Please enable JavaScript.
Coggle requires JavaScript to display documents.
word embeding (词分布 (分布假说 (重点关注对象 (词, 上下文), 理论基础 (上下文相似的词其语义也相似)), 词表示模型…
word embeding
词分布
分布假说
理论基础
上下文相似的词其语义也相似
重点关注对象
词
上下文
词表示模型
模型
基于聚类
基于聚类的clustering模型
神经网络词表示模型
基于矩阵
步骤
矩阵分解(可选)
降维常用方法
奇异值分解(SVD)
非负矩阵分解(NMF)
典型关联分析(CCA)
HPCA
目的
将矩阵降维,把词-上下文矩阵从高维稀疏矩阵变成低维稠密矩阵
选取上下文
常用方法种类
将词附近上下文各词组成的n 元词组(n-gram)作为上下文
优点
2 more items...
缺点
1 more item...
形成词-文档矩阵
缺点
1 more item...
将词附近上下文中的各个词(如上
下文窗口中的5 个词)作为上下文,形成“词-词”矩阵
优点
1 more item...
缺点
1 more item...
找出词词在文档中的关系
确定矩阵中各个元素的值
常用方法
多种加权
平滑方法
目的
对共现矩阵做处理,让得出的结果的效果更好
若干种方法
LSA
“词-文档”矩阵
tf-idf 作为矩阵元素的值
SVD分解
GloVe
核心思想
选择一种方式表示上下文
选择一种模型刻画某个词与上下文间的关系