Coggle requires JavaScript to display documents.
Learning Thematic Similarity Metric Using Triplet Networks
我们的基本假设是属于同一部分的句子通常比出现在不同部分的句子在主题上更相关。其中两个句子来自同一个部分,一个来自不同的部分。
章节的第一句话和该章节的标题作为正例,章节第一句话和上下章节的标题作为反例
开发一个专门的句子相似性度量来解决主题聚类问题,针对比较任务——主题距离比较(TDC):给定一个中心句和另外两个句子,任务是确定哪一个句子在主题上更接近中心。通过训练一个深度神经网络(DNN)来执行TDC,我们可以学习一个主题相似性度量。