hive和hbase区别和联系

garfieldcgf 2021-11-02 原文

作者：有点文
链接：https://www.zhihu.com/question/21677041/answer/185664626
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

先放结论：Hbase和Hive在大数据架构中处在不同位置，Hbase主要解决实时数据查询问题，Hive主要解决数据处理和计算问题，一般是配合使用。

一、区别：

Hbase： Hadoop database 的简称，也就是基于Hadoop数据库，是一种NoSQL数据库，主要适用于海量明细数据（十亿、百亿）的随机实时查询，如日志明细、交易清单、轨迹行为等。
Hive：Hive是Hadoop数据仓库，严格来说，不是数据库，主要是让开发人员能够通过SQL来计算和处理HDFS上的结构化数据，适用于离线的批量数据计算。

通过元数据来描述Hdfs上的结构化文本数据，通俗点来说，就是定义一张表来描述HDFS上的结构化文本，包括各列数据名称，数据类型是什么等，方便我们处理数据，当前很多SQL ON Hadoop的计算引擎均用的是hive的元数据，如Spark SQL、Impala等；
基于第一点，通过SQL来处理和计算HDFS的数据，Hive会将SQL翻译为Mapreduce来处理数据；

二、关系

在大数据架构中，Hive和HBase是协作关系，数据流一般如下图：

通过ETL工具将数据源抽取到HDFS存储；
通过Hive清洗、处理和计算原始数据；
HIve清洗处理后的结果，如果是面向海量数据随机查询场景的可存入Hbase
数据应用从HBase查询数据；

<img src=”https://pic3.zhimg.com/50/v2-2fbb6391206db40675afa8617806a8be_hd.jpg” data-rawwidth=”1954″ data-rawheight=”540″ class=”origin_image zh-lightbox-thumb” width=”1954″ data-original=”https://pic3.zhimg.com/v2-2fbb6391206db40675afa8617806a8be_r.jpg”>

版权声明：本文为garfieldcgf原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/garfieldcgf/p/8144440.html

hive和hbase区别和联系的更多相关文章

随机推荐

Fanuc Cnc 数控系统，PC端下发NC程序到CNC端，现场测试通过。 – 有证程序员
Fanuc Cnc 数控系统，PC端下发NC程序到CNC端，现场测试通过。 1.这几天把FANUC 数据采集( […]...
新版火狐浏览器（61.0.2 (64 位)）之元素定位解析
我们在写自动化脚本进行web测试时，经常会用到元素定位，之前我们用的都是Firebug+Firepath，但浏 […]...
Python3——根据m3u8下载视频（上）之urllib.request
干活干活，区区懒癌已经阻挡不了澎湃的洪荒之力了…… 运行环境：Windo […]...
DB_tools03 securecrt 8.0 windows&macos 安装使用
1. Download2. Install2.1 Windows Install2.2 Macos insta […]...
Linux下的/etc/hosts文件
在Unix系统下面有一个/etc/hosts文件，在我的Mac上，这个文件的内容如下： ## # Host D […]...
【自动部署】服务器自动化操作 RunDeck
RunDeck 是用 Java/Grails 写的开源工具，帮助用户在数据中心或者云环境中自动化各种操作和流程 […]...
CXF整合Spring发布WebService实例
一、说明：上一篇简单介绍了CXF以及如何使用CXF来发布一个简单的WebService服务，并且介绍了客户端 […]...
[转载]尺度函数与小波函数
原文链接：http://blog.sina.com.cn/s/blog_6e8f9abf0100s7vc.ht […]...

展开目录

目录导航