Please enable JavaScript.
Coggle requires JavaScript to display documents.
2.1.2-1 HBase是什麼 (HBase在Hadoop生態圈的位置 (開源數據庫, NoSQL數據庫, 是Apache軟件基金會Hadoop…
2.1.2-1
HBase是什麼
HBase在Hadoop生態圈的位置
開源數據庫
NoSQL數據庫
是Apache軟件基金會Hadoop頂級項目的一部分
為Hadoop提供類似於BigTable規模的服務
HBase運行在Hadoop HDFS之上
列式存儲數據庫
非關係型數據庫
HBase訪問方式
Java的API
REST
MapReduce
Avro的API
Thrift的API
Python
HBase重要特性
高吞吐量處理能力
輕鬆處理海量數據表
高可擴展性
由HDFS保障
非常適合存儲和處理海量稀疏的數據
高可用性、高容錯性
由HDFS保障
Google BigTable
HBase參考了Google的BigTable建模
HBase是基於Google BigTable的開源實現
列上實現了壓縮算法
列上實現了內存操作
所用編程語言:Java
列上實現了布隆過濾器
Google用它對整個互聯網進行搜索
BigTable是核心技術
搜索互聯網需要解決的問題
如何高效的下載網頁
如何存儲整個互聯網
如何索引網頁
如何高效地搜索網頁
HBase是"CP"類型的分布式計算系統
CAP理論
Consistency (一致性) 等同於所有節點訪問同一份最新的數據副本
Availability (可用性) 對數據更新具備高可用性
CAP定理(CAP theorem),又被稱作布魯爾定理(Brewer's theorem),它指出對於一個分布式計算系統來說,不可能同時滿足以下三點
Partition tolerance (分區容忍性)
以實際效果而言,分區相當於對通信的時限要求。系統如果不能在時限內達成數據一致性,就意味著發生了分區的情況,必須就當前操作在C和A之間做出選擇
HBase是NoSQL數據庫
HBase是一個開源的非關係型分布式數據庫(NoSQL)
雖然性能有顯著提高,但還不能直接替換傳統關係型數據庫
應用在數據驅動型的網站
Yahoo!
SalesForce
Twitter
.......
Facebook