文章标题
作者姓名
关键词
单位名称
检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
文章
基于多译文的中文转述语料库建设及转述评价方案
DOI
:
,
PDF
下载:
46
浏览: 473
作者
:
阮翀1,2
;
施文娴1,2
;
李岩昊2
;
翁伊嘉2
;
胡俊峰1,2
;
作者单位
:
1.北京大学计算语言学教育部重点实验室;2.北京大学信息科学技术学院
;
关键词
:
转述知识挖掘
;
转述评价指标
;
转述语料库建设
;
摘要:
转述语料是转述现象研究的基础。针对目前学术界中文转述语料稀缺的现状,该文以《简爱》的多个中文译本为基础,通过句对齐得到五万句级别的平行转述语料(1)。使用无监督的小句对齐和词对齐算法,从语料中挖掘到九千多对词汇转述知识。同时,还复现和改进了机器翻译测评指标Meteor,使得该指标更适合于中文转述句子的测评,并构造了一个中文句子转述测评数据集,以便对不同的转述知识和评价指标进行比较。实验表明,该文算法挖掘到的词汇转述知识在封闭测试中不逊于《同义词词林》。
投稿
相关文章
大数据技术在金融风控中的应用研究
程序化护理干预模式在脑出血患者中的应用及对认知水平的影响研究
一种用于小孔径攻丝的工装设计
一种便携式自动控制气动短路接地装置研制
关于建筑电气安装工程施工质量控制研究
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2