Please enable JavaScript.
Coggle requires JavaScript to display documents.
Курс 5. Прикладные задачи анализа данных (Анализ текстов (Примеры…
Курс 5. Прикладные задачи анализа данных
Бизнес-задачи
Анализ временных рядов
Преобразования Бокса-Кокса
ARMA
ARIMA
SARMA
Анализ остатков
ARMA
Автокорреляция
Критерий AIC Акаики
Стационарность
Анализ поведения пользователей
Важные моменты
Кросс-валидация
Валидационная выборка
Методики построения модели
Перевзвешивание
Оверсэмплинг
Андерсэмплинг
Аудиторные метрики
Удержание
Активность
Монетизация
Привлечение
Анализ текстов
Текстовые данные и работа с ними
Предобработка
Токенизация
Нормализация
Стэмминг
Лемматизация
Извлечение признаков
Счетчики слов
TF-IDF
Смотрится соотношение частоты слова в данном документе и во всех остальных документах
N-граммы
Skip-граммы
К n-граммам добавляются n-граммы с пропусками
Хэширование
Обучение модели
Продвинутые методы анализа текстов
Word2Vec
В отличии от мешка слов можно получить пространство значительно меньшей размерности
Рекурретные сети
Примеры применения
Выделение коллокаций
Языковые модели (последовательный анализ слов)
Анализ тональности текста/отзывов
Аннотирование текстов
ВОПРОСЫ
Хэш-функция
sklearn.pipeline import FeatureUnion