Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data Mining, (KDD - Knowledge Discovery in Databases) - Coggle Diagram
Data Mining
Mineração de Dados
-
CRISP-DM
(1) Entendimento do Negócio (Business Understanding) Foco no entendimento do negócio que visa obter conhecimento sobre os objetivos do negócio e seus requisitos.
(2) Seleção dos Dados (Data Understanding) Consiste no entendimento dos dados, que visa à familiarização com o banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados “modelo”.
(3) Limpeza dos Dados ou Preparação dos Dados (Data Preparation) Fase de preparação de dados, buscando a limpeza, a transformação, a integração e a formatação dos dados da etapa anterior.
(4) Modelagem dos Dados (Modeling) Fase que consiste na modelagem dos dados, a qual visa à aplicação de técnicas de modelagem sobre o conjunto de dados preparado na etapa anterior. Técnicas são baseadas em conceitos de: aprendizagem de máquina; reconhecimento de padrões; estatística; clusterização, etc.
(5) Avaliação do processo (Evaluation) Visa garantir que o modelo gerado atenda às expectativas da organização. Os resultados do processo de descoberta do conhecimento podem ser mostrados de diversas formas.
(6) Execução (Deployment) Esta fase consiste na definição das fases de implantação do projeto de Mineração de Dados.
-
Tipos de Análise
-
Prescritiva
possíveis consequências de cada ação forma de definir qual ação será mais efetiva em determinada situação
-
-
-
-
-
Métricas Principais
Classificação
-
-
-
ROC AUC - Area Under the ROC Curve: área sob uma curva formada pelo gráfico entre a taxa de exemplos positivos corretos, e a taxa de falsos positivos.
-
-
Regressão
Mean Squared Error - MSE
média dos erros do modelo ao quadrado. Ou seja, diferenças menores têm menos importância, enquanto diferenças maiores recebem mais peso.
Root Mean Squared Error (RMSE):Ele é simplesmente a raiz quadrada do primeiro. Neste caso, o erro volta a ter as unidades de medida originais da variável dependente.
-
-
Raking (avalia revisões de ordenamento, recomendação)
-
-
áreas de maior valor
-
-
• possuem dados acessíveis, suficientes e relevantes;
-
campo de estudo que procura encontrar informações que estão implícitas, ou seja, procura padrões e tendências ocultas em base de dados.
A mineração de dados é um campo interdisciplinar que reúne técnicas de aprendizado de máquina, reconhecimento de padrões, estatísticas, banco de dados e visualização para abordar a questão da extração de informações a partir de grandes bases de dados
O Data Mining apoia o conhecimento indutivo, que descobre novas regras e padrões nos dados fornecidos
-