Please enable JavaScript.
Coggle requires JavaScript to display documents.
Tecnologias de Big Data - Coggle Diagram
3.3. Análisis
lo más importante para una organización no es ser capaz de almacenar o procesar datos, sino generar valor a partir de ellos. El valor toma la forma del análisis. La creciente complejidad en el dato ha permeado en la capa del análisis, lo que significa ajustar y modificar los diferentes tipos de análisis a la nueva naturaleza del dato
• OLAP(online analytical processing): método para organizar y consultar datos sobre una estructura multidimensional.
• Cuadros de mando (o dashboard): sistema que informa de la evolución de los parámetros fundamentales de negocio de una organización o de un área de esta a través de componentes visuales integrados.
• Scorecards: tipo de cuadro de mando formado solo por listas de indicadores. A veces también toma la forma de informe.
• Consultas ad hoc: método que ofrece autoservicio y exploración de datos a usuarios finales basados en metadatos de negocio.
• Alertas y monitorización automática: sistema para crear, gestionar y distribuir alertas críticas basadas en indicadores clave de negocio con foco en la gestión de excepciones.
• Cuadro de mando integral (o balancedscorecard): método de planificación estratégica basado en métricas y procesos ideado por los profesores Kaplan y Norton, que relaciona factores medibles de procesos con la consecución de objetivos estratégicos
-
-
-
-
-
-
3.2. Procesamiento
Basado en ELT (Extract, Load, Transform), guardando datos en bruto y transformándolos después.
Enfoques:
Batch processing: latencias de minutos a horas. Ej: MapReduce, Spark.
-
Real-time processing: latencias de milisegundos a segundos. Ej: Storm, Flink, Spark Streaming.
-
-
Motores especializados: H2O, TensorFlow distribuido (para machine learning).
-
3.4. Visualización
Se entiende por data visualization la representación de datos que explota las habilidades visuales para amplificar los procesos cognitivos».
• Determinar el valor que se quiere proporcionar a la audiencia. En este sentido, tenemos dos grandes opciones.
• Seleccionar la visualización correcta. Esto incluye desde la elección del gráfico y/o la representación, al alcance, el horizonte temporal y el tipo de decisiones.
• Elegir las medidas adecuadas, que deben siempre ayudar a tomar decisiones.
• Creación/composición de la visualización, que debe tener en cuenta la forma, la estructura, la funcionalidad y los principios de diseño.
• Uso de criterios de diseño y presentación de información, como la elección de colores y tipografía
-
3.5. Sistemas híbridos
Tras discutir los sistemas de almacenamiento y el procesamiento en el contexto de big data, todo parece indicar que tenemos dos tipos de plataformas diferentes. Las vinculadas con el procesamiento batch y las de streaming. Este pensamiento no anda lejos de la realidad. Las necesidades y el diseño de estos sistemas son diferentes y, sin embargo, una organización puede necesitar ambos enfoques o incluso otros vinculados a NoSQL.
-
-