Please enable JavaScript.
Coggle requires JavaScript to display documents.
Машинное обучение (Обработка данных машинного обучения (4.3. Очистка…
Машинное обучение
Обработка данных машинного обучения
4.1. Типы данных
4.2. Исследование данных
4.2.1. Идентификация переменных
4.2.2. Одномерный анализ
4.3. Очистка данных
4.3.1. Пропущенные значения
4.3.2. Специальные значения
4.3.3. Выбросы
1.3.4. Очевидные несоответствия
4.4. Импутация
4.4.1. Hot-Deck
4.4.2. Cold-Deck
4.4.3. Подстановка среднего значения
4.4.4. Регрессия
4.5. Инжиниринг
4.5.1. Преобразование в категориальные атрибуты
4.5.2. Дискретизация
4.5.3. Пересчет числовые величины
4.5.4. Пересечение
4.6. Отбор признаков
4.6.1. Корреляция.
4.6.2. Ковариантность
4.6.3. Уменьшение размерности
4.6.4. Значения
4.7. Кодирование признаков
4.8. Нормализация или масштабирование
4.8.1. Масштабирование
4.8.2. Стандартизация
4.8.3 Масштабирование до длины единицы
4.9. Построение набора данных
4.9.1. Учебный набор данных
4.9.2. Набор тестовых данных
4.9.3. Валидационные данные
4.9.4. Перекрестная проверка
Модели машинного обучения
3.1 Регрессия
3.1.1 Линейная регрессия
3.1.2 Обобщенные линейные модели (GLM)
3.1.3 Locally Estimated Scatterplot Smoothing (LOESS)
3.1.4 Ridge Regression
3.1.5 Least Absolute Shrinkage and Selection Operator (LASSO)
3.1.6 Logistic Regression
3.2. Байесовские модели
3.2.1. Наивный байесовский классификатор
3.2.2 Multinomial Naive Bayes
3.2.3 Bayesian Belief Network (BBN)
3.3 Уменьшение размерности
3.3.1 Principal Component Analysis (PCA)
3.3.2 Partial Least Squares Regression (PLSR)
3.3.3 Principal Component Regression (PCR)
3.3.4 Partial Least Squares Discriminant Analysis
3.3.5 Quadratic Discriminant Analysis (QDA)
3.3.6 Linear Discriminant Analysis (LDA)
3.4 Instance Based
3.4.1 k-nearest Neighbour (kNN)
3.4.2 Learning Vector Quantization (LVQ)
3.4.3 Self-Organising Map (SOM)
3.4.4 Locally Weighted Learning (LWL)
3.5 Дерево решений
3.5.1 Random Forest
3.5.2 Classification and Regression Tree (CART)
3.5.3 Gradient Boosting Machines (GBM)
3.5.4 Conditional Decision Trees
3.5.5 Gradient Boosted Regression Trees (GBRT)
3.6. Кластеризация
3.6.1 Алгоритмы
3.6.2 Валидация
3.7 Нейронные сети
3.7.1 Нейроны
3.7.2. Входной слой