检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
PDF下载
面向多领域多来源文本的汉语依存句法树库构建
郭丽娟 彭雪 李正华 张民
苏州大学计算机科学与技术学院
摘要:
为了支持汉语句法分析研究,目前句法分析领域已经标注了多个汉语依存句法树库。然而,已有树库主要针对较规范文本,而对各种网络文本如博客、微博、微信等考虑较少。为此,该文基于近期研制的标注规范及可视化在线标注系统,开展了大规模数据标注。聘请了15名兼职标注者,并采用严格的标注流程保证标注质量,目前,已经标注了约3万句的汉语依存句法树库,其中包含约1万句淘宝头条文本。该文重点介绍了数据选取、标注流程等问题,并详细分析了标注准确率、一致性和标注数据的分布
关键词:
依存句法;树库构建;多领域多来源文本
DOI:
基金资助:
文章地址:
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2