Please enable JavaScript.

Coggle requires JavaScript to display documents.

HBase (Perché utilizzarlo (Memorizza grandi quantità di dati, Elevato…

- - - - MemStore (cache per le scritture)
      - BlockCache per le letture
      - Write Ahead Log è il componente che si occupa di verificare che le scritture siano affidabili
      - Funzionamento: ogni tot di tempo i dati nella MemStore vengono scaricati in uno degli HFile
  - - - Diviso in
        
        Minor compaction combina un numero configurabile di file piccoli in uno più grande perché per leggere una particolare riga, ad un certo punto (avendo tanti piccoli file), bisogna effettuare diverse operazioni di lettura dal disco provocando un decremento delle performance
        
        Major compaction combina tutti gli HFile dentro uno più grande. Inoltre, si avrà una pulizia per le operazioni di cancellazione
- - - - Buono per batch processing
    - - Non buono per gli aggiornamenti
      - Non buono per aggiunte di piccoli processi batch
      - Non buono per la ricerca dei record
    - - La scrittura aggiunge solamente infrormazioni
      - La lettura consiste in una scansione totale o parziale della tabella
      - Storage: crearselo da se oppure file sequenziali o altro
      - Dimensione massima dei dati: +30PB
  - - - Ricerca veloce dei record
      - Supporto per inserimento record a livelli
      - Supporto agli aggiornamenti, che vengono creati attraverso una nuova versione del valore (numero che indica la versione)
    - - Scrittura casuale
      - Lettura casuale su un piccolo range oppure sull'intera tabella
      - Data model orientato alle colonne sparse, cioè che i campi nelle righe possono essere vuote o nulle senza sprecare spazio eccessivo; possiamo aggiungere dinamicamente colonne (campi) senza dover ridisegnare lo schema o bloccare operazioni
      - Dimensioni massime per i dati: ~1PB
      - HBase influenza HDFS a mantenere i suoi dati nel disco
      - Affidabilità, disponibilità, scalabilità e alte prestazioni al costo dei server distribuiti
      - No transazioni
      - Denormalizzazione dei dati