Please enable JavaScript.
Coggle requires JavaScript to display documents.
Algoritmo preditivo simples (k-NN) - Coggle Diagram
Algoritmo preditivo simples (k-NN)
Aprendizagem de Máquina e Modelos Preditivos
💡 Aprendizagem de Máquina (Conceitos)
O que é: Campo da IA que permite que sistemas aprendam a partir de dados, identificando padrões sem programação explícita.
Tipos Principais:
Supervisionado: Aprende com dados rotulados (X → Y).
Não Supervisionado: Encontra padrões em dados não rotulados.
Por Reforço: Aprende por tentativa e erro (recompensa/punição).
Ferramentas e Linguagens:
Python (Scikit-learn, Pandas, TensorFlow)
R (Caret, tidyverse)
Plataformas: Google Colab, Jupyter Notebooks
🎯 Aprendizado Supervisionado
Objetivo: Mapear uma entrada para uma saída. Modelos treinam para prever um valor ou categoria.
Técnicas Principais:
2.1. Classificação
Propósito: Prever uma
categoria
discreta (Ex: Sim/Não, A/B/C, Fraude/Não Fraude).
Algoritmos:
k-Vizinhos Mais Próximos (k-NN)
Conceito: Classifica um ponto de dados pela maioria dos votos dos seus
k vizinhos mais próximos
.
Tipo: Algoritmo "Lazy" (aprende na hora da predição).
[Image of k-Nearest Neighbors classification]
Árvores de Decisão
Conceito: Cria um modelo na forma de uma estrutura de árvore, dividindo os dados em nós baseados em atributos.
Vantagem: Fácil interpretação (Regras simples de "Se/Então").
Máquinas de Vetores de Suporte (SVM)
Random Forest (Ensemble de Árvores de Decisão)
2.2. Regressão
Propósito: Prever um
valor contínuo
(Ex: Preço de uma casa, Temperatura, Número de vendas).
Algoritmos:
Regressão Linear Simples/Múltipla
Conceito: Encontra a linha que melhor se ajusta aos dados para modelar a relação entre variáveis.
Saída: $y = \beta_0 + \beta_1 x_1 + \epsilon$
Regressão Logística (Usada para Classificação Binária, não Regressão Contínua)
Regressão Polinomial
🔎 Aprendizado Não Supervisionado
Objetivo: Descobrir estruturas, padrões e grupos ocultos nos dados.
Técnicas Principais:
3.1. Agrupamento (Clustering)
Propósito: Agrupar pontos de dados semelhantes em
clusters
sem rótulos.
Algoritmos:
K-Means
Conceito: Divide os dados em
k grupos
, minimizando a distância entre os pontos e o centroide de cada grupo.
Agrupamento Hierárquico (Hierarchical Clustering)
DBSCAN
Aplicação: Segmentação de Clientes, Agrupamento de Documentos.
3.2. Redução de Dimensionalidade
Propósito: Reduzir o número de variáveis mantendo a maior parte da informação.
Algoritmos:
Análise de Componentes Principais (PCA)
T-SNE
Aplicação: Visualização de Dados, Remoção de Ruído.