Please enable JavaScript.
Coggle requires JavaScript to display documents.
关系抽取 (方法 (基于监督学习 (流水线法 (实体识别错误会影响后面分类, 两两组合会产生冗余信息, 先识别实体,再两两组合分类关系),…
关系抽取
方法
基于监督学习
需要预先想好实体集合,关系集合,相关语料库和有标注的数据
流水线法
实体识别错误会影响后面分类
两两组合会产生冗余信息
先识别实体,再两两组合分类关系
联合抽取法
实体标注和关系分类共用一个特征提取器
直接对实体分类成三元组
实体位置BIES
实体关系编码
实体角色信息
基于模板,包括自定义规则和NER法
准确率高,可以为特定领域定制,启动快,可在小规模数据集上实现
召回率低,特定领域的规则需要专家构建,难以维护,可移植性差
基于无监督或半监督学习
模型
CNN路线
位置信息特征与词嵌入特征拼接
使用多尺度的卷积
丢弃人工词法特征来端对端
使用margin ranked loss
对Other类别特殊处理
RNN+CNN路线
位置编码信息使用indicate来标识
把词嵌入和关系依赖嵌入分别通过LSTM
最后把两个channel拼接用CNN接Softmax来分类
RNN+Attention路线
直接在LSTM后面加注意力层
用两层注意力
关注实体与句子单词联系
关注标签与句子的联系
改进Margin ranked loss
目标是从文本中抽取出多个实体间的语义关系