Please enable JavaScript.
Coggle requires JavaScript to display documents.
Пакетная обработка данных (MapReduce Job (Reducer (Hot keys), Mapper,…
Пакетная обработка данных
Unix-way
MapReduce
DFS
GFS
HDFS
Shared nothing
MapReduce - модель распределенных вычислений
MapReduce Job
Mapper
Reducer
Hot keys
Workflows
Joins и группировка
Map-side join
Reducer-side join
Output
Search index
Database
Reports
Отличия от MPP баз данных
Работаем на обычном железе
Спроектированы для частых сбоев
Хранит сырые данные
Что дальше?
Materialization
Графы
Высокоуровневое АПИ и языки