1.Table中的所有行都是按照RowKey的字典序排列.

2.Table在行的方向上分割为多个HRegion

  

3.Region按照大小分割.每个表刚开始只有一个Region,随着数据不断的插入表中,Region不断增大,当增大到一个阀值的时候Hregion就会等分为两个HRegion.当Table中的行不断增多,就会有越来越多的Region.

4.HRegion是HBase中分布式存储和负载均衡的最小单元.最小单元是指不同的HRegion 可以分布在不同HRegionServer上,但是同一个HRegion不能分布在不同的server上.

5.Hregion是分布式存储的最小单元,但却不是存储的最小单元.事实上,Hbase由一个或多个Store组成,每个Store保存一个ColumnFamily,每个Store又由一个memStore和0到多个StoreFile组成.

如图:StoreFile将以HFile的形式保存在HDFS|上

 

版权声明:本文为dingyanxin原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/dingyanxin/p/4430979.html