Please enable JavaScript.
Coggle requires JavaScript to display documents.
Helen França - Conceitos estruturantes de BI (Modelagem dimensional de…
Helen França - Conceitos estruturantes de BI
Modelagem dimensional de dados
Informação é a interseção de várias dimensões.
Permite ao usuário perceber os dados em mais fácil entendimento.
Com várias perspectivas possíveis e dimensões como tempo e espaço.
Desnormalização das dimensões / esquema estrela
Padrão de estrutura mais fácil e intuitiva
Joined mais fácil
Visão dimensional
Modifica a ordem de distribuição de campos por entre as tabelas.
Voltada para muitos pontos de entrada específicos (dimensões)
Menos voltada para dados granulares em si (fatos).
Estrutura dimensional
Os dados em forma quase estelar
Várias tabelas de entrada se relacionando com poucas tabelas de informação
Notação mais:
Sintética
Legível
Objetiva
Tabela fato
Circundada entre sete e duas dimensões
São núcleos - normalizadas
Dados de interesse concentrado, passíveis de manipulação numérica e estatística
Contém vários fatos
Cada Fato pode armazenar uma ou mais medidas numéricas , que constituem os valores objetos da análise dimensional
Registra ações, eventos, acontecimentos, enfim, fatos que desejam registrar.
Tabelas dimensão
São o ponto de entrada e de filtro inicial e podem ser desnormalizadas
Tabelas satélite que possuem as chaves de entrada do modelo, além das informações descritivas de cada dimensão
Representação
Cubo
Seu conceito é muito usado como sinônimo de data mart
Plano
Rotação de planos ou pivotamento
Mudança dos eixos das dimensões, permitindo transformações na visualização dos dados.
Pontual
Pelo nível de granularidade dos dados armazenados:
Drill-down
Sair de um nível mais alto da hierarquia e ir em busca de informações mais detalhadas em níveis mais baixos, menores.
Ex: Sair de Estados -> Cidades -> Bairros
Modifica o Group by
Roll-up / Drill-up
Inverso do Drill-down
Ex: Sair de dia -> Semana -> Mês
Drill-across
Ideia de poder 'pular' de um esquema para outro, desde que as mesmas dimensões estejam compartilhadas.
Uma espécie de join dimensional
Drill-through
Obter uma informação em nível de detalhe menor do que o posto em tabela fato e permitido pela sua granularidade.
Busca além do nível de granularidade existente na estrutura dimensional.
Alguns comandos:
Ranking
Classifica a informação baseada nos n melhores indicadores
Last-Week:
Mostra valores relacionados a semana anterior, tendo como referência a semana atual
Prior-Week:
Mostra valores relacionados ao período compreendido nos últimos sete dias, tendo como referência o data atual.
Year-to-Date:
Compreendendo o período do ano de ano de referência até a data de hoje.
Dados e sua natureza
Operacional
Valores correntes
Os dados são dinâmicos
Estrutura relacional
Atualização campo a campo
Processamento repetitivo
Otimizado para faixas abaixo de 1 seg para tempo de resposta
Informacional
Valores sumarizados, calculados, integrados de várias fontes
Dados estáticos, com
refreshment
dos dados de tempo em tempo
Estrutura dimensional, simplificado, próprio para atividades analíticas
Sobre atualização, acesso granular ou agregado, normalmente sem
update
direto
Estruturado em fatos e dimensões, processamento preditivo
Tempo de resposta maiores, com análises mais complexas
BI
Processo de desenvolvimento que objetiva implementar:
Estruturas especiais de armazenamento de informações, capaz de sustentar a camada de inteligência da empresa e possível de ser aplicada aos negócios
Data Warehouse
Data Marts
ODS (Operational Data Store)
Pode ser entendido como cadastro consolidador de informações, porém ainda mantidas as características de granularidade e de estruturação não dimensional.
Contempla ferramentas de desenvolvimento de aplicações e ferramentas ETC
Extração
Carga
Tratamento
Funções responsáveis por:
Coleta, limpeza, preparação, carga
Staging (Camada intermediária de tratamento e armazenamento de dados)
Tratamento
Limpeza, combinação, acertos e batimentos(
matches
), que serão fonte de carga do DW.
Abordagem DW e DM
Bill Inmon
Ciclo de vida dos dados
Interativo
Mais atuais com maior probabilidade de consumo
Integrados
Horas e alguns meses de vida
Quase in-line (near line)
Entre 3 e 5 anos de vida / próximo de uma disponibilidade quase imediata.
Separados (archival)
Mais de 5 anos de vida / espécie de arquivo morto
Visão próxima dos projetos em espirais, com implementações menores.
Ralph Kimball
Estilo simples e incremental
Schema Star
Desvantagens:
Possibilidade de produzir diversos DM, sem alta coesão
Provável duplicação de esforços na fase de extração, preparação e carga
Aplicações de DW E DM
Empresas relacionadas com clientes
Financeira
Seguradores, principalmente com técnicas de mining, para rastreamento de fraudes e análise de riscos
Aplicações especiais de tratamento dos dados
OLAP
Processamento Analítico On-Line
Carac. de trabalhar os dados com operadores dimensionais, de forma múltipla e combinada de análise.
Data Mining
Processos de análise de inferência
Uma forma de busca de informação baseada em algoritmos que objetivam o reconhecimento de padrões escondidos nos dados.
BI2
Dados tradicionais + tratamento e análise dos DNE
DNE - Dados não estruturados