Please enable JavaScript.
Coggle requires JavaScript to display documents.
Pré-processamento de dados - Coggle Diagram
Pré-processamento de dados
Etapas
Transformação
pode realizar
Normalização
Reescala
Padronização
Discretização
Conversão de valor numérico para valor simbólico
One-hot encoding
transforma cada categoria de uma variável em uma nova variável binária
Redução
pode ser feita com
Seleção de subconjunto de atributos
Geração de subconjuntos
Forward generation
Bidiretional generation
Stochastic generation
Backward generation
Busca
Avaliação
baixa correlação
Critério de parada
Redução da numerosidade
Representação de dados menores
Redução de dimensionalidade
PCA
Transformação de Wavelet
Limpeza
trata
Dados ruidosos
remoção por clustering
suavização por regressão
suavização por 'Método de Binning'
Dados incompletos
substituição com média ou mediana do atributo
substituição com valor mais frequente do atributo
remoção
Dados redundantes
remoção
Eliminação manual de atributos
manutenção dos atributos relevantes
Integração
unificar os dados obtidos
Amostragem
Equilibrar quantidade de dados, acurácia e eficiência computacional
Balanceamento
Oversampling
pode gerar overfitting
Undersampling
aumenta o risco de acontecer underfitting
treinar modelos para classificar cada classe separadamente
Processo semiautomático
gera
Dados preparados para aplicação de aprendizagem de máquina