Please enable JavaScript.
Coggle requires JavaScript to display documents.
OLAP, Data Mining e ERP (DM (classificação das tarefas (Uma tarefa de…
OLAP, Data Mining e ERP
-
Granularidade
-
Quanto maior o nível de detalhes, menor o nível de granularidade.
O nível de granularidade afeta diretamente o volume de dados armazenado no DW e, ao mesmo tempo, o tipo de consulta que pode ser respondida.
Roll-up
também conhecida como drill-up, aplica uma agregação sobre o cubo de dados.
Ou ainda, aumentar o nível de granularidade dentro de uma dimensão, reduzindo o detalhamento da informação.
Drill-down:
É o inverso da operação de roll-up. É uma forma de navegar
de um dado com menor nível de detalhe para um dado com maior nível de detalhe
Essa operação pode ser realizada tanto descendo em uma hierarquia de uma dimensão quanto introduzindo dimensões adicionais.
Slice and dice:
A operação de slice executa uma seleção sobre uma das
dimensões de um determinado cubo, resultando em um subcubo.
-
Slice CORTA uma dimenção, DICE CORTA duas ou mais.
Pivot:
Também conhecida como rotate ou rotação, é uma operação de visualização que rotaciona os eixos de um determinado cubo
-
drill-across
-
-
A ideia é você conseguir consultar as múltiplas tabelas fato e colocar o resultado em um único data set.
Drill-across: Significa mudar de uma classificação em uma dimensão para outra em uma dimensão diferente.
OU ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão. Por exemplo sai de ano direto para dia ignorando o més e o semestre
É uma técnica similar ao drill-down. A diferença é que
o drilling ser feito horizontalmente, ao invés de verticalmente.
Drill-through
Essa operação pode se utilizar das facilidades de SQL para,
a partir do cubo de dados, penetrar (drill through) até as tabelas relacionais de back-end.
Assim, permite a movimentação de um dado, em um
determinado nível do cubo para dados de nível operacional.
As tabelas de drill-through permitem que você exiba, em
tempo de consulta, os detalhes dos dados não sumarizados a partir dos quais uma célula de uma tabela ou uma seleção de células é sumarizada.
-
Drill-Through to Detail Level: Permite uma transição suave de uma base multidimensional e agregada para o nível de detalhamento de registro nas fontes
de dados do repositório de DW.
O objetivo nesse caso, é mergulhar na hierarquia dos dados para observa-los nomaior nível de detalhamento, chegando, às vezes, a consultar as bases
de dados transacionais que deram origem aos dados agregados do DW.
Tipos de servidores OLAP
MOLAP: Multidimensional On-Line Analytical Processing refere-se aos servidores que usam um MDDB para armazenar dados. Estratégia pela qual são usados gerenciadores de banco de dados proprietários
dispõe de propriedades especiais de armazenamento como
matrizes esparsas, operações com array e indexações de bitmap. Porém não oferece toda a gama de recursos encontrada num SGBDR, como debug, paralelismo, log, otimizadores e monitoração.
Exige a migração dos dados do SGBD relacional para o armazenamento multidimensional e a sua constante atualização.
pode apresentar, em tese, melhor desempenho do que as
alternativas relacionais.
-
Estruturas básicas, e cubos são são armazenados no mesmo formato.
ROLAP: especifica que o servidor OLAP se baseia numa base de dados relacional: Relational On-Line Analytical Processing. Os dados de origem são inseridos em um banco de dados relacional, geralmente em um esquema estrela ou esquema floco de neve, o que ajuda em tempos de recuperação mais rápidos.
uma tecnologia bem estabelecida que tem muitas oportunidades para otimização. Suporta maior quantidade de dados que uma MDDB.
é um servidor intermediário que fica entra a base de
dados relacional de back-end e as ferramentas de front-end.
-
HOLAP: Hybrid OLAP Server representa uma abordagem de uso misto das duas estratégias anteriores, estruturas relacionais => menor granularidade ; dimensional maior granularidade.
DOLAP: Desktop Olap Server representa uma abordagem na qual as estruturas dimensionais ou relacionais são transferidas do DW/DM para as estações cliente.
DM
Data Mining é automático: é um processo, é iterativo, requer
supervisão.
-
Software são intuitivos e simples: é mais importante conhecer os conceitos dos algoritmos e o negócio em si!
Data Mining pode identificar problemas no negocio: DM pode encontrar padrões e fenômenos, identificar causa deve ser feito por especialistas.
-
-
-
regras para associação
O Suporte é uma medida objetiva para avaliar o interesse de uma regra de associação. Representa a porcentagem de transações (%) de um banco de dados de transações onde a regra se verifica.
-
A Confiança é outra medida objetiva para regras de associação que mede o grau de certeza de uma associação. Em termos estatísticos, trata-se simplesmente da probabilidade condicional P (Y | X), isto é, a porcentagem de transações contendo os itens de X que também contém os itens de Y.
-
As combinações que satisfazem esta condição são chamadas
de conjunto de itens grandes, enquanto que os que não satisfazem, são chamados de conjunto de itens pequenos;
Para verificar a validade de uma regra, a confiança da regra (suporte(Y) / suporte(X)) deve satisfazer o valor mínimo de confiança informado. Ou seja O conjunto K >= 2
Passos principais:
- 1 Gerar todas as combinações de Itens
- 2 Descobrir Conjuntos de Itens (considerando um limiar.
- 3 Gerar regras de associação para a base de dados
Propriedades para descoberta dos conjuntos-itens:
- Fechamento por baixo, ou seja, um itemset grande também deve ser grande.
- Antimonotonicidade um superconjunto de um itemset pequeno também é pequeno (implicando que ele não tem suporte suficiente).
Sendo assim quando se descobre um itemset pequeno, então qualquer extensão deste itemset será pequeno.
-
Padrões de análise
Análise de padrões sequenciais: Um padrão sequencial é uma expressão da forma < i1;.....; in >, onde cada i é um conjunto de itens. < {carro}, {pneu, toca-fitas} > representa o padrão
“Clientes que compram carro, tempos depois compram pneu e toca-fitas de carro”. UMA AÇÃO Em SEQUENCIA DA OUTRA
Análise de Padrões em Séries Temporais: Séries temporais são sequencias de eventos, cada evento pode ser um tipo fixo dado uma transação. Ações e fundos de investimento por exemplo.
Predição – Consultando o dicionário encontramos a seguinte definição: dizer antecipadamente o que vai acontecer, seja por meio de regras certas, pretensa adivinhação ou conjetura.
Análise de Outliers - Um banco de dados pode conter dados que não apresentam o mesmo comportamento padrão da maioria. Estes dados são denominados outliers (exceções). Muitos métodos de mineração descartam estes outliers como sendo ruído indesejado.
Regressão - é uma aplicação especial da regra de
classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada regressão.
A mineração de dados apoia o conhecimento indutivo, que descobre novas regras e padrões nos dados fornecidos.
-