Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data Warehouse vs Data Mart - Coggle Diagram
Data Warehouse vs Data Mart
Data Warehouse
DIFERENCIAS
Es una base de datos central con facultades de conectar con prácticamente cualquier fuente de datos y con grandes capacidades de almacenaje.
Es mucho más costoso y duradero —suele durar varios meses e incluso un año—
Recopila datos de una gran variedad de
fuentes
DEFINICIÓN
Normalmente cumple la función de almacén de datos central de una organización o, en otras palabras, es la base de datos donde están integrados todos los datos útiles de una compañía.
La particularidad del Data Warehouse es que está estructurado para facilitar el orden y la comprensión de los datos, precisamente por esto es tan utilizado en el mundo empresarial.
Es 'Almacén de Datos' y, ciertamente, es exactamente eso, un almacén de integración de datos.
El Data Warehouse está diseñado para facilitar el entendimiento y favorecer el análisis de datos, ya que se integra a herramientas de Business Intelligence como Power BI. En Bismart, como empresa partner Power BI de Microsoft, se tabaja con esta herramienta para ofrecer las mejores capacidades técnicas a los clientes.
Un Data Warehouse, pues, es un almacén de datos que, por sus características, convierte los activos de datos eninformación entendible, organizada, actualizada y preparada para ser analizada.
Asimismo, no es una base de datos operacional. Es decir, los datos integrados a un Data Warehouse no están pensados para ser usados inminentemente, si no que se almacenan para un futuro uso.
BENEFICIOS
Los usuarios empresariales o ejecutivos no tendrán que esperar hasta que TI se ponga a generar los informes, y
el departamento de TI se enfocará en su principal objetivo que es mantener el negocio funcionando.
Data Warehouse incluye la conversión de datos de numerosos sistemas de origen a un formato común.
Al proporcionar datos de varias fuentes, los ejecutivos ya no tomarán decisiones basadas en datos limitados o simple instinto
Almacena grandes cantidades de datos históricos para analizar diferentes períodos de tiempo y tendencias
con el fin de realizar predicciones futuras.
TIPOS
Data Mart
Es un subconjunto del almacenamiento de datos orientado a un área específica, también conocido como base de información departamental.
Está especialmente diseñado para una línea de negocio
particular, como ventas o finanzas.
Data Lake
Es un repositorio centrado en almacenar gran cantidad de datos estructurados y sin estructurar sin importar su escala.
Permite almacenar los datos tal cual vienen sin necesidad de ser estructurados.
Operational Data Store (ODS)
También conocido como ODS, es un almacén de datos, que cuando el almacenamiento de datos y los sistemas OLTP no admiten las necesidades de los informes de las organizaciones.
En ODS, todo el almacenamiento de datos se actualiza en tiempo real y/o con baja latencia de actualización
Data Mart
BENEFICIOS
Son comparativamente más adaptables que un almacén de datos.
La generación de datos dirigidos a perfiles de negocio.
Son más fáciles de implementar y más rentables que construir una empresa. almacenamiento de datos.
Es un mecanismo de respuesta rápido para consultar información antes de realizar un cambio en un proceso empresarial.
Diseñado de acuerdo con los requisitos de un grupo particular de usuarios que trabajan en un departamento específico.
Permite un acceso más rápido a los datos recuperando un conjunto específico de datos para BI y generación de informes.
DIFERENCIAS
Almacena una cantidad de datos reducida y de temática concreta, relacionada con un departamento empresarial o línea de negocio determinada.
suele recoger datos de la base de datos central
Ejerce como la base de datos global de un negocio y almacena datos referentes a cualquier aspecto relacionado con la empresa,
es una subárea de un Data Warehouse, de capacidad de almacenaje reducida y orientada a resolver las dudas de los consumidores de datos respecto a un área del negocio en concreto.
DEFINICION
Es decir, en un Data Mart se almacenan conjuntos de datos concisos y específicos dispuestos al análisis para un departamento o línea de negocio concreto como, por ejemplo, el departamento comercial.
La intención del uso del Data Mart es indexar datos para facilitar las queries sobre áreas específicas del negocio y satisfacer las necesidades de un grupo concreto de usuarios dentro de la organización como, por ejemplo, los miembros del equipo de ventas o de finanzas.
Un Data Mart es un subjconjunto de una base de datos —habitualmente un Data Warehouse— donde los datos son
almacenados para un área del negocio concreta
Su implementación es fundamental en un negocio, pues de esta manera la empresa puede integrar y combinar la información en un Data Mart para descubrir oportunidades y amenazas indetectables en las bases de datos operacionales
TIPOS
Centro de datos independiente
Se puede crear una despensa de datos independiente sin utilizar el almacén de datos central.
Se recomienda
principalmente para unidades o grupos más pequeños dentro de una organización
Centro de datos híbrido
Mediante el uso de una despensa de datos híbrida, puede combinar datos de varios sistemas de origen operativo además de un almacén de datos.
Estos son particularmente útiles cuando necesita una integración
ad hoc, como agregar un nuevo grupo o productos a la empresa.
Centro de datos dependiente
Un centro de datos dependiente le permite combinar todos sus datos comerciales en un solo almacenamiento de datos, ofreciéndole los beneficios típicos de la centralización.
se necesitan almacenes de datos departamentales y tendrá que crearlos como entidades dependientes para garantizar la coherencia y la integración en todos los sistemas de almacenamiento de datos.
Diseño de un Data Mart
Rellenar / Transferencia de datos
El siguiente paso es llenar el mart, lo que significa transferir datos al mismo.
Esto generalmente implica extraer información de origen, limpiar y transformar los datos
y cargarlos en el repositorio departamental.
En esta fase, también puede establecer la frecuencia de la
transferencia de datos, como diaria o semanal.
Acceso a los datos
En este paso, los datos cargados en la despensa de datos se utilizan para realizar consultas, generar informes, gráficos y publicar.
La
tarea principal involucrada en esta fase es configurar una meta-capa y traducir las estructuras de la base de datos
Construir / Construir
El siguiente paso es construirlo. Esto incluye la creación de la base de datos física y las estructuras lógicas.
En esta fase, creará tablas
de hechos, tablas de dimensiones, campos, índices y controles de acceso.
Diseño
El primer paso es crear un diseño robusto.
Algunos procesos críticos involucrados en esta fase incluyen recopilar los requisitos corporativos y técnicos, identificar las fuentes de datos, elegir un subconjunto de datos adecuado y diseñar el diseño lógico (esquema de la base de datos) y la estructura física.
Gestionar
Controlar el acceso continuo de los usuarios.
Optimización y perfeccionamiento del sistema de destino para mejorar el rendimiento.
Adición y gestión de nuevos datos al repositorio.
Configurar los ajustes de recuperación y garantizar la disponibilidad del sistema en caso de falla.