Please enable JavaScript.

Coggle requires JavaScript to display documents.

Arquitectura y ecosistemas de big data, image, image, image - Coggle…

- - - - MapReduce: MapReduce.
      - Tez: Directed Acyclic Graph (DAG).
      - Spark: Resilient Distributed Datasets (RDD).
      - Flink: Flujos de datos cíclicos.
  - - - MapReduce: Ninguna.
      - Tez: Ninguna.
      - Spark: Optimización para consultas SQL.
      - Flink: Optimización para todo tipo de API
- - - - Ingesta de datos: Herramientas y procesos para capturar datos desde diversas fuentes, como bases de datos, dispositivos IoT, redes sociales, entre otros.
      - Almacenamiento: Infraestructura que permite guardar los datos de manera escalable y económica.
      - Microsoft Learn
      - Procesamiento: Motores que permiten transformar y analizar los datos almacenados, como Apache Spark o Databricks.
      - Catálogo de datos: Sistema que organiza y proporciona metadatos para facilitar la búsqueda y gestión de los datos.
      - Nimbus Intelligence
      - Seguridad y gobernanza: Mecanismos que aseguran el acceso controlado, la privacidad y la calidad de los datos.
      - Interfaz de usuario: Herramientas que permiten a los usuarios finales acceder y analizar los datos, como dashboards o notebooks.
- - - - Estructura → define cómo se organizan los datos desde la ingesta hasta el análisis.
      - Modelos → incluyen arquitecturas por lotes, en tiempo real, Lambda y Kappa.
      - Tecnologías → sistemas de almacenamiento distribuido (HDFS, S3), motores de procesamiento (Hadoop, Spark) y herramientas de ingesta y análisis.
- - - - Conectores a diferentes sistemas de almacenamiento de datos, como Amazon S3 o HDFS.
      - Conectores a diferentes motores de procesamiento de datos, como Spark,MapReduce o Flink.
      - Conectores a diferentes almacenes de datos, como Hbase o Presto.