Please enable JavaScript.
Coggle requires JavaScript to display documents.
Классификация обращений TS - Coggle Diagram
Классификация обращений TS
Инструменты
классификация обращений
выявление новых тематик
визуальный анализ(облака, новые теги)
Дообучение
Active learning
выявить самые острые примеры
Извлечение ключевых слов
(новых тегов)
https://nlpub.ru/TextRank
https://moluch.ru/archive/118/32878/
http://igorshevchenko.ru/blog/entries/textrank
Gensim проверить:
https://radimrehurek.com/gensim/summarization/keywords.html
:check:
ну такое
mutual information(PMI)
сравнить распределение топ тегов в 1 наборе и недельном
самые частотные
фигня, но выделился
неожиданно fobo
Обзорчик стр 89 :star:
https://www.hse.ru/data/2016/04/22/1130200941/sbornik-19.pdf
самоорганизующиеся карты Кохонена(посмотреть)
Хороший разбор :star:
http://www.machinelearning.ru/wiki/images/a/a8/Mmta19-prep-colloc.pdf
DegExt
Rake
TextRank
KEA
GenEx
KEA
https://www.researchgate.net/publication/340419439_Avtomaticeskoe_izvlecenie_klucevyh_slov_i_slovosocetanij_iz_russkoazycnyh_tekstov_s_pomosu_algoritma_KEA
RAKE
https://github.com/vgrabovets/multi_rake
Метрики
добавить conf matrix, f-меру
feature extr
TF-IDF на
псевдодокументах-классах
:check:
one-hot, elmo,bert,fast-text
bert на общей лексике
2,3-граммы
feature imp из обучения
на самых частотных
в целом
:red_cross:
в классе
добавить грамматики
Visual
Облака тегов на TF-IDF
:check:
вектора
словари
t-SNE!!
:check:
Словарь
вернуть англизмы(crm,s2s)
s2s -слово цифры?
MX14, 999 склад
почистить имена/фамилии
:check:
добавить склад №
Модели
сетки
арх-ра из сентимента
на Bertе
подбор параметров
кросс-вал
over|under sampling
генерация обращений
самых худых классов
imblearn
text similarity
для 0 класса
LDA для 0 класса
https://link.medium.com/CiJWZgQQD7
:!:
n-бинарных классификаций