Please enable JavaScript.
Coggle requires JavaScript to display documents.
自然语言理解 (NLU) (一系列结构预测任务 (中文分词, 词性标注, 实体命名识别, 句法分析, 共指解析, 语义角色标注), 研究路径…
自然语言理解 (NLU)
一系列结构预测任务
中文分词
词性标注
实体命名识别
句法分析
共指解析
语义角色标注
研究路径
斟字酌句:实现句级消歧和精准理解
瞻前顾后:初步实现对文本内复杂语境建模,建立对篇章或对话的理解
博学多识:引入更多外部知识,实现跨模态和主观性因素
善解人意:考虑语言的社会性和主观性因素
冥思苦想:将语言作为思想的工具,实现从语言理解到使用的跨越,实现创作和规划能力。
自然语言的特点
创新性
晒照片VS晒被子;被子很潮VS时尚很潮
递归性
语言套娃现象
多义性
原来是喜欢一个人,现在是喜欢一个人
主观性
受到个人经历和认知水平影响
社会性
全球化带来的中英混杂
社会形态的反应
社会地位的反应
刻板印象,政治偏见等
有待探索
符号与分布式表示相结合,既保留分布式表示的泛化能力,又兼顾模块化和层次化符号带来的抽象能力。
构建人类知识
领域知识:中暑需要如何救治
世界知识:我们需要想办法降温
常识知识:这个夏天温度很高很热
语言知识:The summer is like an oven.
多模态复杂语境理解
需要外部的复杂语境进行消歧
字的多义性解析靠所在的词组
词的多义性解析靠所在句子
句子的多义性解析靠所在语篇或对话语境,甚至是复杂的世界知识来帮助理解
语境开放,多模态,依赖上下文文本信号,说话语气,所处环境视觉信号,其它无法名状的各类信息等。
多门学科不同角度思考和关注
语言学:对句法和语义问题建立理论。
心理学:对人类语言习得进行探讨
语言哲学:对语言与世界的关系探讨。
认知语言学:对隐喻和范畴等问题探讨。
神经语言学:对人脑语言功能研究。
汉语言学:对特殊语言现象进行研究。
难点
找到与人类心智相媲美的语义表示空间
符号表示过于粗糙,无法考虑语言符号背后反映的丰富语义信息
分布式表示虽表示能力强大且自由度高,但只能通过特定日任务下数据学习,建立满足特定需求的语义表示,缺少可解释性,鲁棒性差。通用性和迁移性都不足。