Please enable JavaScript.
Coggle requires JavaScript to display documents.
BD - Coggle Diagram
ORIGEN DE DATOS
Producidos por personas
Entre maquinas M2M
Biomentricas
Marketing web
Transacciones de datos
TIPOS DE DATOS SEGÚN ESTRUCTURA
Datos Estructurados
(
los que tradicionalmente se han usado
)
Datos No Estructurados
(
Datos en su forma original tal y como fueron recogidos
)
Datos Semiestructurados
(
Irregular para gestionarla como datos estructurados
)
7 V del
Big Data
Velocidad
Volumen
Variedad
Veracidad
Valor
Visualización
Variabilidad
CILCLO DE GESTION DE INFORMACION
1 Captura de Información
2 Almacenamiento
3 Tratamiento
4 Puesta en valor
BENEFICIOS
Tecnologías agiles y flexibles
Es escalable
Rapido y Económico
Open Source (software de codigo abierto)
Logro de objetivos
CASOS DE EXITO EN LA APLICACIÓN
Tecnologias y Procesos
Big Data
Problemas actuales del Modelo Realcional
-Tipos de datos.Variedad -Escalabilidad -Modo realcional -Velocidad
Soluciones y bases de datos propuestas
NoSQL
escalabilidad, heterogeneidad y rendimiento
Cassandra
algoritmo
MapReduce
sistema de archivos
HDFS
la creación de clusters de nodos que trabajan en
paralelo como un nodo solo
aplicaciones
de las BD como
HBASE
o
HIVE
Herramienta que crea esos procesos MapReduce
de forma automática a partir de HQL (parecido a SQL).
Hadoop
Framework para desplegar
aplicaciones de forma distribuida
Aplicar en
BI
como:
fuente de datos, como Stage de nuestro
sistema o como DataWerehouse final al cual atacaremos
MongoDB
Kettle
herramienta de integración de datos
Open Source
Pentaho
Ayudara al consultor sin tener conocimiento, prodra realizar
ETL´s
de forma mas sencilla y rapida.