Please enable JavaScript.
Coggle requires JavaScript to display documents.
DIFERENCIAS ENTRE DATOS ESTRUCTURADOS Y NO ESTRUCTURADOS (DATOS NO…
DIFERENCIAS ENTRE DATOS ESTRUCTURADOS Y NO ESTRUCTURADOS
DATOS NO ESTRUCTURADOS
El 80 % de la información relevante para un
negocio se origina en forma no estructurada, principalmente en formato texto.
Son datos binarios que no tienen estructura interna identificable.
Es un conglomerado masivo y desorganizado de varios objetos que no tienen valor hasta que se identifican y almacenan de manera organizada.
No poseen una estructura interna
identificable.
Se trata de un cúmulo de información que deben identificarse y almacenarse de forma organizada a través
de una base de datos no relacional (NoSQL).
Se pueden alamacenar en:
Documentos PDF.
• Documentos Word.
• Correos electrónicos.
Habitualmente, se suelen categorizar como datos semiestructurados. No obstante, el campo del mensaje no está estructurado y las herramientas tradicionales de análisis no son capaces de identificarlos.
• Datos móviles: mensajes de texto, ubicaciones, mensajería instantánea, grabaciones telefónicas, etcétera.
• Hojas de cálculo.
• Vídeos y audios.
• Publicaciones en medios sociales.
DATOS ESTRUCTURADOS
Información que se suele encontrar en la mayoría de bases
de datos relacionales
Suelen ser archivos de texto que se almacenan en formato tabla, hojas de cálculo o bases de datos
relacionales con títulos para cada categoría que permite identificarlos.
Para gestionar estos datos se utiliza un tipo de lenguaje de programación estructurado, SQL
(Structured Query Language) diseñado para administrar y recuperar información de sistemas de gestión de bases de datos relacionales (RDBMS).
Son datos que pueden ser ordenados y procesados fácilmente por todas las herramientas de minería de datos.
DATOS
Un dato es la unidad mínima de información.
Un objetivo de Big Data es transformar los datos en información
útil.
Facilita
la toma de decisiones y se está convierte en oportunidades de negocio.
En Big Data podemos distinguir dos tipos: estructurados y no estructurados.
¿Qué es un dato?
Es la representación de una variable (cualitativa o cuantitativa) que indica un valor asignado.
Es información y la información es poder.
Examinar y medir un conjunto masivo de datos.
Obtener resultados que puedan ser de interés para
los objetivos de nuestra empresa.
Los datos estructurados se almacenan en el Dataware House.
Ejercer análisis sobre cada uno de ellos
Los no estructuradas
permanecen en el Data Lake, aunque a veces incluyen estructurados y semiestructurados.
Tendremos que hacer es organizarlos o tabularlos.
NAOMI MONCAYO COBOS / 4A1
DIFERENCIAS
FACILIDAD DE ANÁLISIS
Los datos estructurados otorgan al usuario de
facilidad de análisis para la obtención de resultados medibles.
Los datos no estructurados
necesitan herramientas analíticas más complejas.
FLEXIBILIDAD
Los no estruturados son mucho mas flexibles.
ALMACENAMIENTO
Los datos estructurados se almacenan en una base de
datos relacional (RDBMS),
Los datos no estructurados no pueden almacenarse en estructuras de datos
relacionales predefinidas (NoSQL).
INFORMACIÓN
Los datos de Data Warehouse son más maduros organizados y fiables
Los que permanecen en el Data Lake, destacan por ser un
conglomerado de información masiva.