Please enable JavaScript.
Coggle requires JavaScript to display documents.
Ciencia de Datos - Coggle Diagram
Ciencia de Datos
Inteligencia de Negocios
Introducción a la inteligencia de negocios
¿Qué es la inteligencia de negocio?
Beneficios de un sistema de inteligencia de negocio
¿Cuándo es necesaria la inteligencia de negocio?
Estrategia de Inteligencia de Negocio
¿Cómo detectar que no existe una estrategia?
Modelo de maduración de inteligencia de negocio
Soluciones Open Source para Inteligencia de Negocio
Pentaho
Diseño de un almacén de datos
El núcleo de un Sistema de BI: el almacén de datos
Elementos de un almacén de datos
Tipos de tablas de hecho
Tipos de dimensiones
Tipos de métricas
Arquitectura de un almacén de datos
Presentación caso práctico: análisis de estadísticas web
Formato de un log
Necesidades de negocio
Fases de un proyecto de BI
Resolución caso práctico con MySQL
Modelos de datos
Conceptual
Lógico
Físico
Diseño de procesos ETL
Integración de datos: ETL
Técnicas de integración de datos
Tecnologías de integración de datos
Uso de la integración de datos
ETL en el contexto Pentaho
Caso práctico
Contexto
Diseño con Pentaho Integración de Datos
Subsistemas ETL de Kimball
Diseño de análisis OLAP
OLAP como herramienta de análisis
Tipos de OLAP
Elementos OLAP
12 reglas OLAP
OLAP en el contexto de Pentaho
Mondrian
Visores OLAP
Herramienas de desarrollo
Caso práctico
Diseño de OLAP con Schema Workbench
Publicación de esquema OLAP Pentaho Server
Diseño de informes
Informes e inteligencia de negocio
Tipos de informes
Elementos de un informe
Tipos de métricas
Tipos de gráficos
Informes en el contexto Pentaho
Pentaho Reporting
Pentaho Report Designer
WAQR
Pentaho Metadata
Caso práctico
Diseño de capa de metadatos en Pentaho
Diseño de informe basado en capa de metadatos de Pentaho
Diseño de informe mediante wizard Pentaho
Diseño de informe Pentaho Report Designer
Diseño de cuadros de mando
Cuadro de mando como herramienta de monitorización
Elementos de cuadro de mando
Proceso de creación de un cuadro de mando
Dashboard vs Balanced ScoreCard
Cuadro de mando en el contexto de Pentaho
Comnunity Dashboard Framework
Pentaho Dashboard Designer
Caso práctico
Cuadro de mando mediante CDF
Anexos
Consejos para crear un cuadro de mando
Consideraciones sobre uso de tablas y gráficos
Tendencias en Inteligencia de Negocios
Factores de evolución
Computación ubicua
Computación en la nube
Economía de la atención
Incremento desproporcionado de datos
Mercado altamente dinámico y competitivo
Empresa extendida
Democratización de la información
Open Source
Nuevos modelos de producción
Social media
Open Knowledge
Tendencias en Inteligencia de Negocio
Inteligencia negocios operacional
Gestionar datos como un archivo
Revolución tecnológica
Impacto del Open Source en Inteligencia de Negocios
Minería de Datos modelos y algoritmos
Introducción
Introducción a la minería de datos
Etapas de un proyecto de Minería de datos
Tipologías de tareas y métodos
Conceptos preliminares
Análisis estadístico
Métricas de distancia o similitud
Entropía y ganancia de información
Preparación de los datos
Limpieza
Normalización
Discretización
Reducción dimensionalidad
Validación y evaluación de resultados
Entrenamiento y test
Conjuntos de
Entrenamiento
Test
Validación
Evaluación de resultados
De modelos de
Clasificación
Regresión
Agrupamiento
Extracción y selección de atributos
Selección de atributos
Extracción de atributos
Métodos no supervisados
Agrupamiento jerárquico
Dendogramas
Algoritmos
Divisivos
Aglomerativos
Método k-means y derivados
k-means
Métodos derivados de k-means
fuzzy c-means
Agrupamiento Canopy
Concepto de preclustering
Funcionamiento del método
Ejemplo de aplicación
Métodos supervisados
Algoritmo k-NN
Funcionamiento del método
Detalles del método
Selección empírica del valor de k
Máquinas de soporte vectorial
Definición margen e hiperplano separador
Cálculo del margen y del hiperplano separador óptimo
Funciones kernel
Tipos funciones kernel
Redes neuronales
Las neuronas
Arquitectura de una red neuronal
Entrenamiento de red neuronal
Optimización proceso aprendizaje
Redes neuronales profundas
Árboles de decisión
Detalles del método
Poda del árbol
Métodos probabilísticos
Naive Bayes
Máxima entropía
Combinación de clasificadores
Combinación paralela de clasificadores base similares
Combinación secuencial de clasificadores base similares
La ingeniería del Big Data cómo trabajar con datos
Bienvenidos al mundo de los datos
Introducción
Motivación
Fundamentos en la evidencia
El germen del data driven
Datos engendran información, conocimiento y más datos
Datos, información y conocimiento
Una visión del significado de data driven
La empresa y la transformación digital
Transformación digital
Conversión digital y digitalización
Impacto de las transformaciones digitales
Usar datos en empresa digital
Pensando un proyecto de datos
Ingeniería de datos
¿Qué es realmente Big Data?
Atributos del Big Data
Evolución del Big Data
Plataformas de consulta estructurada SQL
Procesamiento en lotes o batch
Procesamiento cercano al tiempo real o NRT
Plataformas de inteligencia artificial
Fundamentos de una arquitectura de datos
Perspectivas prácticas
Etapas y tecnologías
Empezando de cero: caminando hacia producto mínimo viable
Primer paso: Pensando en objetivos
Segundo paso: Definir un producto mínimo
Por dónde y por qué empezar
Concepto e idea de desarrollo iterativo
Tercer paso: Lograr viabilidad
¿Cómo obtener valor en cada iteración?
¿Cuándo finalizan las iteraciones?
¿Cómo socializamos el MVP?
Errores de novatos y otras lecciones aprendidas a golpes
Definiciones tácticas
Inteligente tiene diferentes significados
Valor de proceso puede no estar en su resultado primario
La complejidad: un espejismo seductor
Las métricas: caprichosas señoras
Sin un anillo para gobernarlos a todos
Uróboros: volviendo al comienzo
El rol del antropoevangelista
Rito de pasaje
Nos convertimos en expertos de datos
Diferencia entre entusiastas y expertos
Relacionándonos con las partes interesadas
Pensamiento estratégico de datos
El guardián y garante del enfoque data driven
Juntando bloques para construir castillos
Creando plataformas de datos
¿Cómo plantear las plataformas?
Estadios de desarrollo
¿Cómo implementarlas?
Arquitecturas
Lambda
Kappa
¿Cómo desplegarlas?
Estrategias de puesta en producción
Distribuciones Hadoop
Caminando hacia la inteligencia artificial
Conceptos básicos para un diálogo
Motivos que permiten explosión de IA
Extrayendo valor de la inteligencia
Iniciativas de
Alta factibilidad
Alto potencial
Al plató: interrogantes y temas a resolver
Bifurcaciones y profundizaciones
Cuestiones sin resolver
Organizaciones orientadas al dato
Contexto actual
La evolución del dato
El reto tomar decisiones en un entorno altamente competitivo
¿Por qué algunas empresas compiten mejor que otras?
¿Qué estrategias de datos existen?
Hacia la organización orientada al dato
¿Qué es una organización orientada al dato?
¿Cómo transformarse en una organización orientada al dato?
Niveles de competencias analíticas
Métodos, técnicas y herramientas analíticas
Pensamiento analítico
Implantación de proyectos analíticos
Definiendo el problema
Resolviendo el problema
Comunicando y actuando en función de resultados
Nuevos roles organizativos
Evolución de los perfiles de datos
Del trabajador de la información al trabajador analítico
Alineando quants y non quants
El largo camino de la orientación al dato
Principales retos
Opciones para desarrollar una organización orientada al dato
La necesidad de los centros de competencia
BIG DATA gestión y explotación grandes volúmenes datos
¿Qué es el Big Data?
Definición
Componentes de las definiciones
Significado del término
Cambio paradigmas
Características grandes volúmenes datos
Volumen
Variedad
Velocidad
Veracidad
Variabiliad/Vigencia
Viabilidad
Valor
Tecnologías, técnicas y metodologías para procesar grandes volúmenes de datos
¿Cómo gestionar eficientemente?
Cadena valor
Generación datos
Obtención datos
Recogida
Transmisión
Preprocesamiento
Integración
Extracción
Transformación
Carga
Limpieza
Eliminación redundancia