Please enable JavaScript.
Coggle requires JavaScript to display documents.
MINERAÇÃO DE DADOS PARTE 2 - Coggle Diagram
MINERAÇÃO DE DADOS PARTE 2
#DATA WAREHOUSE (DW)
Data Warehouse =Armazém de Dados!
Data Warehouse é um banco de dados especializado em gerar relatórios,
logo sua performance para esse tipo de processamento é extremamente eficiente.
RELATÓRIOS SÃO ALIMENTADOS PELO:ETL (Extract, Transform, Load). Em outras palavras, esse processo realiza três operações: Extract – extrai as informações do banco de dados transacional; Transform
– transforma as informações para o formato adequado; e Load – carrega as informações no Data
Warehouse! Entendido
Esse modelo apresenta alta performance, uma vez que os usuários estão distribuídos
subconjuntos de Data Warehouse (DW) são
chamados de Data Mart (DM).
2 Granularidade é o nome que se dá ao nível de sumarização dos elementos de dados de um Data Warehouse.
Quanto maior a granularidade, maior será o grão e menor será o nível de
detalhes; quanto menor a granularidade, menor será o grão e maior será o nível de detalhes.
3 – Características Essenciais
Data Warehouse é orientado por assunto:
Data Warehouse é não-volátil:
ele não muda com facilidade
Data Warehouse é integrado:
Isso significa que as inconsistências são removidas e os conflitos de informações são consertados antes de serem inseridos ou carregados em um Data Warehouse
Data Warehouse é histórico
(variável com o tempo):
4 – Tipos de Data Warehouse
Enterprise Data Warehouse (EDW),
é um repositório central tático/estratégico que contém todas as informações de negócio de uma organização de forma acessível para toda empresa com a finalidade de suportar as análises de decisões
Operational Data Store (ODS) e
trata-se de um repositório intermediário de dados utilizado para relatórios operacionais e como uma fonte de dados para o Enterprise Data Warehouse (EDW). É um elemento complementar a um EDW em um cenário de
suporte a decisões, e é usado para relatórios, controles e tomada de decisões operacionais – em oposição ao EDW, que é utilizado para suporte de decisões táticas e estratégicas.
Data Mart (DM)!
trata-se de um subconjunto de dados de um Data Warehouse. Geralmente são dados referentes a um assunto em especial
Semestral, Vendas Mensal, entre outros), que focalizam uma ou mais áreas específicas.
(Ex: Vendas, Estoque, Controladoria, entre outros) ou diferentes níveis de sumarização (Ex: Vendas Anual, Vendas
5 – Processo de Data Warehouse
Data Sources:
Comentários: basta lembrar da nossa figura – os componentes são as Fontes de Dados (Data Sources), Extração de Dados (Extract), Carregamento de Dados (Load), Banco de Dados Abrangente (Enterprise Data Warehouse), metadados (Metadata) e Ferramentas de Middleware (Letra A).
localização temporária de onde os dados dos
sistemas de origem são copiados.
Em seguida, os dados são transformados, isto é, uma série de regras ou funções são aplicadas aos
dados extraídos para prepará-lo para carregar em seu destino final; depois os dados são integrados
ou seja, são uniformizados em um padrão específico;
Kimball x Inmon
KIMBALL (DM) )
Abordagem Bottom-Up (Data Marts Data Warehouse)
Orientação Orientado a processos de negócio
investimento Inicial Baixo
Normalização Desnormalizad
Direcionamento Usuários finais
Consultas Realizadas no Data Warehouse
Segundo Kimball, a modelagem dimensional é a única técnica viável para bancos de dados
INMON (EDW
Top-Down (Data Warehouse Data Marts)
Orientado a dados
investimento Inicial Alto
Consultas Realizadas no no Data Mart
Normalização Normalizado (3ª Forma Normal)
DirecionamentProfissionais de TI