文本分类

预处理

数据增广

模型选择

模型融合

特征工程

基本特征

高级特征

词汇数量

字符数量

平均字长

停用词数量

特殊字符数量

数字数量

大小字母数量

N-grams语言模型

TF-IDF

词袋模型

情感分析

词嵌入

大小写转换

去除标点符号

停用词

高频、稀疏词

拼写矫正

分词

词干提取和词形还原

EDA

回译

同义词替换

随机插入

随机交换

随机删除

fastText

TextCNN

TextRNN

RCNN

RNN+Attention

Bert微调

Blending

Stacking