Please enable JavaScript.
Coggle requires JavaScript to display documents.
MINERAÇÃO DE DADOS (DATA MINING) - Coggle Diagram
MINERAÇÃO DE DADOS
(DATA MINING)
CICLO DE VIDA DA INFORMAÇÃO
Os momentos são vivenciados justamente quando os ativos físicos, tecnológicos e humanos fazem uso da informação, sustentando processos que, por sua vez, mantêm a operação da empresa.
MANUSEIO
Momento em que a informação é criada e manipulada, seja ao folhear um maço de papéis, ao digitar informações recém-geradas em uma aplicação Internet, ou, ainda, ao utilizar a senha de acesso para autenticação
ARMAZENAMENTO
Momento em que a informação é armazenada, seja em um banco de dados compartilhado, em uma anotação de papel posteriormente postada em um arquivo de ferro, ou, ainda em uma mídia qualquer.
TRANSPORTE
Momento em que a informação é transportada, seja ao encaminhar informações por correio eletrônico, ao postar um documento, ou, ainda, ao falar ao telefone uma informação confidencial.
DESCARTE
Momento em que a informação é descartada, seja ao depositar na lixeira da empresa um material impresso, seja ao eliminar um arquivo eletrônico em seu computador de mesa, ou ainda, ao descartar uma mídia usada que apresentou falha na leitura
CICLO DE VIDA DOS DADOS
ARMAZENAMENTO
RECUPERAÇÃO
COLETA
DESCARTE
DATA MINING OU
MINERAÇÃO DE DADOS
É UM PROCESSO PARA EXTRAIR DADOS ESPECÍFICOS DE UM GRANDE BANCO DE DADOS .
PARA ISSO , HÁ ALGUMAS TÉCNICAS ;
REDES NEURAIS
são sistemas computacionais baseados numa aproximação à computação baseada em ligações.
INDUÇÕES DE REGRAS
refere-se à detecção de tendências dentro de grupos de dados, ou de “regras” sobre o dado.
ÁRVORES DE DECISÃO
baseiam-se numa análise que trabalha testando automaticamente todos os valores do dado para identificar aqueles que são fortemente associados com os itens de saída selecionados para exame.
ANÁLISE DE AGRUPAMENTOS
O uso de técnicas de estatística
REGRAS DE ASSOCIAÇÃO
são usadas para descobrir elementos que ocorrem em comum dentro de um determinado conjunto de dados.
OUTLIERS
São dados que não apresenta o mesmo padrão da maioria dos dados, são uma exceção, discrepantes.
ETAPAS DA MINERAÇÃO
TRANSFORMAÇÃO
NORMALIZAÇÃO
SUAVIZAÇÃO
AGREGAÇÃO
GENERALIZAÇÃO
INTEGRAÇÃO
MINERAÇÃO
CLASSIFICAÇÃO
CLUSTERIZAÇÃO(AGRUPAR)
ASSOCIAÇÃO
LIMPEZA
AVALIAÇÃO
APRESENTAÇÃO
NORMATIZAÇÃO DE DADOS
É um conjunto de regras que visa, principalmente, a organização de um projeto de banco de dados para reduzir a redundância de dados e anomalias, aumentar a integridade de dados, consistência e o desempenho.
As normalizações são divididas em 3 formas básicas:
Segunda Forma Normal (2FN)
•Para estar na 2FN é preciso estar na 1FN;
•Os atributos normais devem depender unicamente de chaves primárias da tabela.
Terceira Forma Normal (3FN)
•Para estar na 3FN é preciso estar na 2FN.
•3FN define que todos os atributos dessa tabela devem ser funcionalmente independentes uns dos outros, ao mesmo tempo que devem ser dependentes exclusivamente da chave primária da tabela.
Primeira Forma Normal (1FN)
•Atributos precisam ser atômicos (Simples, Monovaloradose indivisíveis);
•Tabelas não podem ter valores repetidos. (Atributos não repetidos);
•Não é permitido relações aninhadas;
•Tabela não pode ter Atributos com mais de um valor.