Please enable JavaScript.
Coggle requires JavaScript to display documents.
文本分类 (预处理 (大小写转换, 去除标点符号, 停用词, 高频、稀疏词, 拼写矫正, 分词, 词干提取和词形还原), 模型选择…
文本分类
预处理
大小写转换
去除标点符号
停用词
高频、稀疏词
拼写矫正
分词
词干提取和词形还原
模型选择
fastText
TextCNN
TextRNN
RCNN
RNN+Attention
Bert微调
数据增广
EDA
同义词替换
随机插入
随机交换
随机删除
回译
模型融合
Blending
Stacking
特征工程
基本特征
词汇数量
字符数量
平均字长
停用词数量
特殊字符数量
数字数量
大小字母数量
高级特征
N-grams语言模型
TF-IDF
词袋模型
情感分析
词嵌入