Please enable JavaScript.

Coggle requires JavaScript to display documents.

Hadoop & Hadoop Infrastructure - Coggle Diagram

- - - - database transaction : series of operations ensuring data consistency
      - ACID : atomicity : All operations complete or none do consistency : Data remains accurate and valid. isolation:Transactions run independently
        Durability: Changes persist even after failures.
      - steps : Initial State → Operations (INSERT, UPDATE, DELETE) → Commit (finalize) or Rollback (revert).
    - - MapReduce Computing Model:Used for processing large data sets with a distributed algorithm on a cluster.
      - Division of Job into Tasks
        Each task is either a map or reduce operation.
- - - - Stockage : Les datasets sont stockés sur HDFS, garantissant un stockage distribué et fiable.
      - Phase Mapping : Les datasets sont divisés en morceaux. Les mappers traitent ces morceaux en parallèle et créent des paires clé-valeur (ex. : un ID commun entre les datasets).
      - Shuffle et Sort : Les paires clé-valeur sont triées et regroupées par clé (les clés communes aux deux datasets).
      - Phase Reducer : Les reducers prennent les paires triées, joignent les enregistrements ayant la même clé (par exemple, associer un utilisateur à son département) et produisent le résultat final.