Please enable JavaScript.
Coggle requires JavaScript to display documents.
HBase, 保证任意时间集群只有一个master.
存储所有Region的寻址入口
实时监控Region…
HBase
数据模型
-
列族
列是由列族组进行组织的
a. 一个列族所有成员具有相同的前缀
比如:courses:history, courses: math都是列族courses的成员
b. 冒号是列族的分隔符,用来区分前缀和列名
c. 列族必须在表建立的时候声明,而列可以在使用的使用是进行声明
d.
-
-
-
-
-
-
基础架构
-
Region Server
组成
-
Region
- Table中所有都按照row key的字典序列排序
- Table按照行方向(Rowkey)来分为多个Region
3.Region是HBase中分布式存储和负载均衡的最小单位
4.每个表只有一个region(但是region增加到阀值之后会分割)
-
-
-
-
-
-
-
- 保证任意时间集群只有一个master.
- 存储所有Region的寻址入口
- 实时监控Region Server的状态并实时通知Master
Master和Region Server启动都需要向ZK注册
- 存储HBase的schema和table元数据
- 同时提供多个Zookeeper来负载均衡和避免单点故障
-
- 为Region Server分配Region
(所有Master down掉以后不影响读写,但是不能创建新表)
- 负责Region Server的负载均衡
- 管理用户对table的增删改查操作
- 负责维护region,处理对这些region的IO请求
- 负责切分在运行过程中变得过大的Region
- 非必须选项(默认开启),用来记录HBase中的所有数据,保障了数据高可用性
- 做容错恢复的作用,感觉类似于Oracle的redo log
- 在HDFS上,WAL的默认路径是/bbase/WALs
通过hbase.wal.dir进行配置
- 在RegionServer更新(put,delete)操作时,数据首先记录到WAL(也就是HLog中),然后再写入Store的的MemStore以及最终的StoreFile(HFile)
-