Please enable JavaScript.
Coggle requires JavaScript to display documents.
HBase (Perché utilizzarlo (Memorizza grandi quantità di dati, Elevato…
HBase
-
Data model
-
-
Le colonne sono raggruppate in column families, le quali devono essere definite alla creazione della tabella
Le column families sono raggruppate assieme nel disco per avere un accesso simile aumentando le prestazioni
Le colonne hanno dei qualificatori che sono dei nomi specifici assegnati al valore. Virtualmente sono illimitati nel contenuto, nella lunghezza e nel numero
I valori immagazzinati hanno il timestamp. E' un modo di identificare univocamente un dato. I dati sono memorizzati in ordine decrescente così da restituire sempre il valore più aggiornato
Architettura
Region Servers
-
Implementa l'auto sharding, ovvero il carico di una tabella viene distribuito su altri Region Server quando si supera una certa soglia
-
-
-
Zookeeper
Cluster distribuito di server che collettivamente forniscono coordinazione e sincronizzazione per le applicazioni
-
-
HDFS vs HBase
-
-
HBase
Vantaggi
-
-
Supporto agli aggiornamenti, che vengono creati attraverso una nuova versione del valore (numero che indica la versione)
Caratteristiche
-
-
Data model orientato alle colonne sparse, cioè che i campi nelle righe possono essere vuote o nulle senza sprecare spazio eccessivo; possiamo aggiungere dinamicamente colonne (campi) senza dover ridisegnare lo schema o bloccare operazioni
-
-
Affidabilità, disponibilità, scalabilità e alte prestazioni al costo dei server distribuiti
-
-
-
CAP Theorem: CP, ovvero consistenza e Partition Tolerance. Non può sempre essere disponibile