Please enable JavaScript.
Coggle requires JavaScript to display documents.
SoPa (模型基准 (Bi-LSTM, DAN, CNN, Hard), Introduction (为什么SoPa具有吸引力…
SoPa
模型基准
Bi-LSTM
DAN
CNN
Hard
Introduction
RNN
对序列编码
表现力高
CNN
对特定窗口编码
表现力低
为什么SoPa具有吸引力
能捕捉更灵活的模式
WFSAs模型的成熟高效灵活
模式可端对端地训练
用向量来表达文档
匹配可变长度地短语
WFSAs如何表示模式?
一个句段被分成d个状态
从START状态到END状态走一遍
每个状态可选三种转换
self-loop
允许一个状态消费多个词
main path
向前一个状态,消费一个词
ε-transition
允许向前一个状态,不消耗词
数据集
SST
烂番茄电影评论
Amazon
电子产品评论
ROC
四句故事结局预测
结果
与基准的表现对比
消融实验分析
解释性
Abstract
WFSAs将RNN和CNN桥接
成果
与四个基准模型持平或更好
小数据集更有优势
Background
Surface patterns的定义
WFSAs基础
如何给文档评分?
特定模式共现次数
维特比算法最高得分匹配
与RNN关联
self-loop
Sigmoid
与CNN关联
移出所有元件,仅保留main path
固定长度的模式
如何聚集多个模式?
堆栈成一个向量
MLP
SoftMax