PDF下载
面向医疗文本的实体及关系标注平台的构建及应用

张坤丽1 赵旭2 关同峰1 尚柏羽2 李羽蒙1 昝红英1

1.郑州大学信息工程学院;2.鹏城实验室

摘要: 医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。
关键词: 文本标注;标注平台;实体标注;关系标注;数据分析
DOI:
基金资助:
文章地址: