Please enable JavaScript.
Coggle requires JavaScript to display documents.
Mining Processing Data Science - Coggle Diagram
Mining Processing Data Science
1 - Obtenção dos dados
Pandas
IBGE Parsing
CAGED
2 - Analise exploratória inicial
Pandas
SweetViz
Proffiling
ANÁLISE MULTIVARIADA
http://bdtd.ibict.br/vufind/Record/URGS_1d1bc8d4318b57fd82140eb377a286e2
Klib
Autoviz
ExploriPy
3 - Seleção de características e Redução de dimensionalidade
Seleção de Características (variaveis categoricas)
mutual_info_regression
Mutual information-based feature selection
Métodos para selecionar as melhores variáveis do dataset em Python!
Chi Square
Ferramentas do Scikit Learn
Aprenda como selecionar Features para seu Modelo de Machine Learning
Inicar Leitura
chi2-explained search
Tutorial: Pearson's Chi-square Test for Independence
Linear discriminant analysis (generalization of Fisher's linear discriminant)
Sistemática de seleção de variáveis para classificação
de produtos em categorias de modelos de reposição
Chi-Square Statistic: How to Calculate It / Distribution
Seleção de Características (variaveis float)
Principal Component Analysis
Recursive Feature Elimination – RFE
5 - Aplicação de algoritmos
Aprendizagem Supervisionada
Tree Learning
Decision Trees - Explain Scikit
sklearn.tree.DecisionTreeClassifier
Naive Bayes
Regressão Linear
Regressão Logística
Suport vector Machine (SVM)
Ensemble Methods
Aprendizagem Não supervisionada
Clustering
Decomposição de valores singulares
Analise de componentes princiais
Análise de componentes independentes
4 - Transformação dos dados
OneHotEncoding
Labeling and Encoders
category_encoders
sklearn.preprocessing.LabelEncoder
Category Encoders
Guide to Encoding Categorical Values in Python
other roadmaps
https://pbpython.com/roadmap.html
https://coggle.it/diagram/XW15yGn5-6A7Z1RO/t/comp312p-machine-learning
Local Notebooks Tree Learning
http://localhost:8888/notebooks/principal35/analises_preditivas/discip_mso/TreeLearningDataset%20Simples%20PlayTennis.ipynb
Sample Datasets
Simple Sample dataset
PlayTennis
House Sales in King County, USA
https://datasetsearch.research.google.com/
7 Steps Google Ml
1 - Capturar dados (Gathering data)
2 - Preparar dados (Preparing data)
3 - Escolher o Modelo (Choosing a model)
4 - Treinamento (Training)
5 - Avaliação (Evaluation)
6 - Ajustar hiperparametros (Hyperparameter tunning)
7 - Predição (Prediction)
Avaliação
Acuracia
Matriz
Introdução basica para iniciantes com ORANGE
https://medium.com/ensina-ai/machine-learning-sem-c%C3%B3digo-636d1a8f9081
AutoML
PyCaret
Tutoriais
https://github.com/pycaret/pycaret/blob/master/tutorials/Binary%20Classification%20Tutorial%20Level%20Intermediate%20-%20CLF102.ipynb
Livro ML
Plataformas
https://docs.google.com/document/d/1Vy6CqOdVyzNMWqowpT44TVH1xtaTtOndY2k0jUoiZ1o/edit#
Lembrar que estou alternando entre Google Docs e Writer (local) por causa do índice e da facilidade de edição offline (por caussa do problema com o google)