Please enable JavaScript.

Coggle requires JavaScript to display documents.

TEMA 3: TECNOLOGIAS DEL BIG DATA - Coggle Diagram

- - - - Data Visualization persigue incrementar las capacidades exploratorias y explicativas
    - - El método visual de presentar información para hacerla más comprensible y fácil de comprender
    - - Seleccionar la visualización correcta.
      - Creación/composición de la visualización
        
        Uso de criterios de diseño y presentación de información
      - Conocer la audiencia de la visualización.
      - Elegir las medidas adecuadas
      - Determinar el valor que se quiere proporcionar a la audiencia
- - - - tenemos dos tipos de plataformas diferentes. Las vinculadas con el procesamiento
        
        batch
        
        .– Precalcular las vistas batch
        
        Gestionar un conjunto de datos maestros a los que se añade el dato nuevo en bruto
        
        streaming
        
        La capa de velocidad complementa la capa de distribución proporcionando una mayor frecuencia de actualizaciones y solo trabaja con los datos más recientes.
        
        Las necesidades y el diseño de estos sistemas son diferentes y, sin embargo,
        
        una organización puede necesitar ambos enfoques o incluso otros vinculados a NoSQL.
        
        Los datos se distribuyen tanto a la capa batch como a la capa velocidad (enreferencia a streaming) para su procesado.
        
        El funcionamiento de la arquitectura Lambda
        
        Este enfoque tiene el beneficio de que reduce la complejidad de mantenimiento del código, por lo que poco a poco va convirtiéndose en la opción preferida
        al compararla con la arquitectura Lambda.
- - - - HA
        
        HA implica tener un esquema en el
        
        que los tiempos de caídas deben mantenerse muy cortos en un periodo anual
      - FT
        
        FT hace referencia a un sistema donde no existe la posibilidad de perder ni un solo minuto de trabajo en producción, lo que tener infraestructura totalmente redundante
  - - - TECNOLOGÍAS DEL ALAMACEMIENTO
  - - - 1) Key-value store: el almacenamiento se fundamenta en el uso de parejas clave-objeto en las que no hay esquema alguno. Ejemplos: Apache HDFS, Riak, Voldemort, Redis, RocksDB o Amazon DynamoDB.
      - 2) Bases de datos orientadas a columnas: el almacenamiento del dato se realiza por columnas, no por filas. Ejemplos: Apache Hbase, Apache Cassandra, MonetDB, Druid, HP Vertica, SAP IQ, LucidDB, ScyllaDB o Amazon SimpleDB.
      - 3) Bases de datos de grafos: usa nodos y vértices para representar datos. Ejemplos: Neo4J, HyperGraphDB, ArangoDB, Ontotext GraphDB u OrientDB.
      - 4) Bases de datos orientadas a documentos: el almacenamiento del dato se realiza como si fuera un documento semiestructurad o. Ejemplos: MongoDB, CouchDB o MarkLogic.