基于局部语义相关性的定义文本义原预测
1.清华大学计算机科学与技术系;2.清华大学人工智能研究院;3.清华大学智能技术与系统国家重点实验室
摘要: 作为人类语言的最小语义单位,义原已被成功应用于许多自然语言处理任务。人工构造和更新义原知识库成本较大,因此义原预测被用来辅助义原标注。该文探索了利用定义文本为词语自动预测义原的方法。词语的各个义原通常都与定义文本中的不同词语的语义有相关关系,这种现象被称为局部语义相关性。与之对应,该文提出了义原相关池化(SCorP)模型,该模型能够利用局部语义相关性来预测义原。在HowNet上的评测结果表明,SCorP取得了当前最好的义原预测性能。大量的定量分析进一步证明了SCorP模型能够正确地学习义原与定义文本之间的局部语义相关性。
关键词:
义原预测;HowNet;语义相关性;
义原预测;HowNet;语义相关性