Please enable JavaScript.
Coggle requires JavaScript to display documents.
序列标注 (中文分词 (特征提取 (字在语料库中出现次数, 出现为4种状态的概率, 状态转移概率, 上下文关系), 三大难点 (标准, 歧义,…
序列标注
中文分词
特征提取
字在语料库中出现次数
出现为4种状态的概率
状态转移概率
上下文关系
三大难点
标准
歧义
新词
方法
基于词典
正向最大匹配法
逆向最大匹配法
双向最大匹配
缺点,歧义难解决
基于统计
HMM
CRF
DL+CRF
好的分词决定后面语言高阶的理解,非常重要
词性标注(POS)
实体命名识别(NER)
关系抽取(RE)