面向儿科疾病的命名实体及实体关系标注语料库构建及应用
昝红英1 刘涛2 牛常勇1 赵悦淑2 张坤丽3 穗志方4
1.郑州大学信息工程学院;2.鹏城实验室;3.郑州大学第三附属医院;4.北京大学计算语言学教育部重点实验室
摘要: 当前医学语料库实体及实体关系的分类体系难以满足精准医学发展需求的问题,该文针对儿科疾病开展研究。在医学领域专家的指导下制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;融合国内外相关医学标准资源,利用标注工具对298余万字儿科医学文本中实体及实体关系进行机器预标注、人工标注及人工校对,构建了面向儿科疾病的医学实体及关系语料库。所构建的语料库包含504种儿科常见疾病,共标注命名实体23 603个,实体关系36 513个,多轮标注一致性分别为0.85和0.82。基于该语料库构建了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统。
关键词:
儿科疾病;语料库建设;命名实体;实体关系;知识图谱;
儿科疾病;语料库建设;命名实体;实体关系;知识图谱