Please enable JavaScript.
Coggle requires JavaScript to display documents.
Tipos e Integración de Datos en Big Data, Jair Alfonso Suárez Flores …
Tipos e Integración de Datos en
Big Data
Tipos de datos
. Los datos tienen su origen de muchas fuentes. Algunas de las más destacadas son las siguientes.
Web y Redes Sociales
: datos que se obtienen de los usuarios digitales. Estos incluyen likes, comentarios, publicaciones, fotos, etc
Datos de transacciones
: estos incluyen facturaciones de compras, ventas, stock de artículos, clientes, etc.
Datos Biométricos
: estos datos se generan a partir de nuestras características físicas, de conducta o fisiológicas, como la voz, la retina del ojo o la huella dactilar.
Datos generados por humanos
: ejemplos de estos son llamadas de atención al cliente, correos electrónicos ingresados para iniciar sesión en una plataforma o formularios digitales contestados.
Máquina a Máquina (M2M)
: se originan a través de la intercomunicación de dispositivos, por ejemplo, un software de control de stock que recibe datos de las máquinas, lo que le permite realizar un inventario de manera autónoma.
Categorías de datos
.
Estructurados
: son datos ordenados y agrupados en un formato predefinido. Es por esta característica que su procesamiento resulta sencillo.
No Estructurados
: datos que no tienen una estructura identificable.
Integración de Datos
. Es la recopilación de datos de distintas fuentes para asegurar datos completos y precisos.
Sirve para la
creación de data lakes
, ya que algunas empresas desean tener uno para almacenar todos sus datos empresariales.
Almacenamiento
de datos en un almacén de datos o data center para sincronizar dichos datos con diferentes sistemas.
La integración de datos sirve de apoyo al momento de realizar una
migración de datos
hacia un nuevo sistema.
Métodos de Integración de Datos
Integración con uso de Middleware
: al usar un middleware se facilita la integración de los datos procedentes de sistemas heredados o legacy que por su antigüedad no encajan bien con el resto de sistemas.
Integración de almacenamiento común
: se hace una copia de los datos de todas las fuentes en un almacén de datos.
Integración manual
: la persona encargada de la integración recopila y limpia los datos de distintas fuentes y luego los combina en un mismo almacén. Generalmente esto se hace en empresas muy pequeñas.
Jair Alfonso Suárez Flores
Procesamiento Masivo de Datos 2023-A
Prof. Víctor Hugo Vega Fregoso
domingo, 25 de febrero de 2023