Please enable JavaScript.
Coggle requires JavaScript to display documents.
justdoc - Coggle Diagram
justdoc
Подготовка датасета
Чтение в pandas фрейм исходных данных
Выделение колонки text для каждого пациента
Нормализация сырых данных
Приведение в нижний регистр
Удаление лишних символов
Подсчет размерности
Разделение raw text на сущности
Парсинг через regexp для извлечения текстовых ответов
Преобразование текстовых данных в категориальные и бинарные
Сохранение обработанного датасета
Подсчет количества записей
Открытие файла train.csv
Выявление мажорных features
Обучение алгоритма решающих деревьев DecisionTrees
Получение графа логики работы модели
Сохранение модели в pickle
Предварительный анализ датасета
Выделение ключевых фичей
web front-end часть для получения данных и передачи модели
Вывод предсказания