Hadoop、HDFS、Hive、Hbase之间的关系

liyuanhong 2021-11-04 原文

Hadoop：是一个分布式计算的开源框架

HDFS：是Hadoop的三大核心组件之一

Hive：用户处理存储在HDFS中的数据，hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。

Hbase：是一款基于HDFS的数据库，是一种NoSQL数据库，主要适用于海量明细数据（十亿、百亿）的随机实时查询，如日志明细、交易清单、轨迹行为等。

Hive与HBase的区别与联系

区别：

Hive：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能。

Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表纯逻辑。hive需要用到hdfs存储文件，需要用到MapReduce计算框架。
hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。

HBase：HBase是Hadoop的数据库，一个分布式、可扩展、大数据的存储。

hbase是物理表，不是逻辑表，提供一个超大的内存hash表，搜索引擎通过它来存储索引，方便查询操作
hbase可以认为是hdfs的一个包装。他的本质是数据存储，是个NoSql数据库；hbase部署于hdfs之上，并且克服了hdfs在随机读写方面的缺点。

联系：

Hbase和Hive在大数据架构中处在不同位置，Hbase主要解决实时数据查询问题，Hive主要解决数据处理和计算问题，一般是配合使用。

在大数据架构中，Hive和HBase是协作关系，数据流一般如下图：

通过ETL工具将数据源抽取到HDFS存储；
通过Hive清洗、处理和计算原始数据；
HIve清洗处理后的结果，如果是面向海量数据随机查询场景的可存入Hbase
数据应用从HBase查询数据；

版权声明：本文为liyuanhong原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/liyuanhong/articles/14518037.html

Hadoop、HDFS、Hive、Hbase之间的关系的更多相关文章

Hadoop学习笔记—Yarn
Hadoop-yarn的安装配置，错误处理目录一些基本知识 ResourceManager 的恢复 Res […]...
Hive、Pig、HBase的关系与区别
欢迎关注大数据和人工智能技术文章发布的微信公众号：清研学堂，在这里你可以学到夜白（作者笔名）精心整理的笔记，让 […]...
Hadoop伪分布式环境搭建
1、准备环境(VMware、CentOS7/node-14.rar)-. 解压 node-14.rar这个压缩包到指定目录-. 找到解压之后的node/node.vmx 这个文件，双击它，会通过WMware打开-. 在VMware...
Hadoop HA高可用搭建流程
8.3 HDFS-HA集群配置 8.3.1 环境准备 1. 修改IP 2. 修改主机名及主机名和IP地址的映射 […]...
shells/hadoop
1 #!/bin/bash2 case $1 in3 ""){4 /root/shells/stopfirewalld.sh5 /root/shells/wait-time.sh 36 /root/shells/hadoop.sh star...
【史上最全】Hadoop 核心 – HDFS 分布式文件系统详解(上万字建议收藏)
1. HDFS概述 Hadoop 分布式系统框架中，首要的基础功能就是文件系统，在 Hadoop 中使用 Fi […]...
Hadoop超详细讲解之单节点搭建
1 Hadoop介绍 Hadoop是Apache旗下的一个用java语言实现开源软件框架，是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。狭义上说，Hadoop指Apach...
hadoop介绍
hadoop介绍1.狭义上hadoop是指Apache软件基金会的一款开源软件，允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理 2.hadoop核心组件hadoop HDFS(分布式文件存储系统)：解决海量数据存储...

随机推荐

基于模糊数学的“拍照赚钱”任务定价最优方案研究
基于模糊数学的“拍照赚钱”任务定价最优方案研究摘要随着移动互联网的快速发展，越来越多的企业将大量线上、 […]...
分享5个主流的HTML5开发工具
HTML5被看做是web开发者创建流行web应用的利器，增加了对视频和Canvas 2D的支持。跨平台性非常强 […]...
Stream流与Lambda表达式（六） SpliteratorDetail
package com.java.design.java8.Stream.StreamDetail.BaseS […]...
动态加载图片展示方式短边充满容器，图片不拉伸
需求： 1.如果高≥宽图片不变形图片的宽=缩略图框的宽 […]...
【nodejs】大事件后台管理系统（四）——layui前端布局与改进
6. layui大事件项目文件位置：1.Node.js零基础入门教程\node.js—资料\day8\素材\大事件项目在assets/js/baseAPI.js中修改统一请求根路径6.1 调整接口名称纯粹是因为之前本人手贱，故意修改名...
层模型–绝对定位(position:absolute)
如果想为元素设置层模型中的绝对定位，需要设置position:absolute(表示绝对定位)，这条语句的作用 […]...
网页版电子表格控件tmlxSpreadsheet免费下载地址 – longbookj
网页版电子表格控件tmlxSpreadsheet免费下载地址 tmlxSpreadsheet 是一个由Java […]...
windows下用过VMware安装MAC OS X苹果系统
vmware怎么安装os x10.9？vmware 10安装mac os 10.9教程详解来源：互联网作者 […]...

展开目录

目录导航