Please enable JavaScript.
Coggle requires JavaScript to display documents.
Hadoop I/O (File-Based Data Structures (SequenceFile, MapFile, Otros),…
Hadoop I/O
File-Based Data Structures
SequenceFile
MapFile
Otros
Compression
ventajas
Menos almacenamiento
Menos ancho de banda
Se debe considerar tradeoff entre
Tiempo comprimiendo
Tamaño comprimido
En hadoop se implementa mediante
Codecs
Serialization
se implementa mediante
RPC Protocol
Data Integrity
es realizado mediante
Checksums
Verificados por
Datanodes
al
Leer y escribir bloques
DataBlockScanner
Verifica la salud de los bloques y reporta al namenode para curar