一、了解hbase的存储体系。

hbase的存储体系核心的有Split机制,Flush机制和Compact机制。

 

1、split机制

每一个hbase的table表在刚刚开始的时候,只有一个region,随着数据的不断插入到表中,region开始增大,当增大到一定的阀值以后,region就会等分两个新的region。

当table表中的行数越多,就会有越来越多的region。

region是hbase中分布式存储和负载均衡的最小单元,相当于HDFS中的block。

2、Flush机制

HStore存储是HBase存储的核心,其中由两部分组成,MemStoreStoreFilesMemStoreSorted Memory Buffer

用户写入的数据首先会写入MemStore,就返回了,所以写性能很高。当MemStore满了以后会Flush成一个StoreFile

3、Compact机制

StoreFile文件数量增长到一定阈值,会触发Compact合并操作,将多个StoreFiles合并成一个StoreFile,合并过程中会对Cell进行版本合并和数据删除。

 

版权声明:本文为invban原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/invban/p/5681268.html