Please enable JavaScript.

Coggle requires JavaScript to display documents.

2009.Distant supervision for relation extraction without labeled data…

- - - - 提供一种从多个句子中整合数据来决定两个实体之间是否存在关系的自然方法
        
        对于每一对实体，将它们出现在许多不同句子中的特征聚合为一个特征向量，从而为分类器提供更多信息，从而得到更准确的标签
      - 是is-a关系的延伸
      - 任何包含一对参与已知Freebase关系的实体的句子都可能以某种方式表达该关系
      - 从许多不同的文档和任何类型中提取关系的证据
      - 如果两个实体参与一个关系，任何包含这两个实体的句子都可能表达这个关系。
  - - - 实体间的二元关系
    - - 这种relation中的单个有序对
    - - 两个实体间的词语顺序
      - 这些词语的词性（veb、n…）
      - 表示句子中哪个实体先出现的标志
      - 实体1左边的k个单词和它们的词性标记组成的窗口
      - 实体2右边的k个单词及其词性标记的窗口
    - - 两个实体间的依赖路径
      - 对于每个实体，一个“窗口”节点不是依赖路径的一部分
    - - 每个特性由句子的几个属性的连接以及命名实体标记组成。
      - 特征出现的次数比较少的话这个特征就会被忽视
  - - - 在训练中，将来自不同句子的相同元组(relation, entity1, entity2)的特征组合在一起，形成一个更丰富的特征向量。
      - 多分类逻辑回归分类器
    - - 使用命名实体识别再次标记实体
      - 出现在一个句子中的每一对实体都被认为是一个潜在的关系实例，每当这些实体一起出现时，就从句子中提取特征并将其添加到该实体对的特征向量中。
    - - 在训练中使用了900000个Freebase关系实例，并且保留了900000个。这些实验在训练阶段使用了80万篇Wikipedia文章，在测试阶段使用了40万篇不同的文章。
      - 我们在培训阶段使用80万篇Wikipedia文章，在测试阶段使用40万篇不同的文章。
    - - 使用freebase提供一系列关系和参与这些关系的实体对的训练集
      - 训练部分所有的实体都是在句子中使用命名实体标记符来标识的
    - - 生成依存树