请选择 目标期刊

基于词向量的藏文语义相似词知识库构建 下载:27 浏览:350

龙从军1,2 周毛克3 刘汇丹2 《中文研究》 2020年4期

摘要:
词向量在自然语言处理研究的各个领域发挥着重要作用。该文从语言学角度出发,讨论了词向量技术与语言学理论的关系;根据词向量的特征,提出利用藏文词向量构建语义相似词知识库。该文以哈尔滨工业大学的《词林》为基础,通过汉藏双语词典对译,在获取对译词的词向量的基础上,计算对译词的词向量与原子词群平均词向量的差值,利用不同的差值,自动筛选出与原子词群语义相似度较小的词。该文分别以藏文的词和音节为单位计算词向量,自动筛出不属于原子词群的词,通过对自动筛选结果与人工筛选结果对比,发现两者具有较高的一致性,这说明词向量计算结果与人的语言直觉具有较高的一致性。总体来说,该文所采用的方法有助于提高藏文语义相似词知识库构建效率。

三元搭配视角下的汉语动词语义角色知识库构建 下载:38 浏览:196

王诚文1 钱青青1 荀恩东1 邢丹1 李梦1 饶高琦1,2 《中文研究》 2020年2期

摘要:
动词语义角色一直是国内外语言学界研究的重点和难点。在自然语言处理领域,相关的语言资源也在逐步构建。对于汉语而言,国内大部分工作集中在语义角色标注上。该文创造性地提出了一种三元搭配的动词语义角色知识表征形式,并在前人研究的基础上,提出了一套语义角色分类体系。在该体系指导下,对汉语动词进行了穷尽式的语义角色认定及相关知识加工,以构建汉语动词语义角色知识库。截至目前,该工程考察了5 260个动词,加工了语义角色及引导词的动词数量为2 685个,加工认定语义角色4 307个。

汉语基本复合名词短语语义关系知识库构建与识别 下载:35 浏览:220

张文敏 李华勇 邵艳秋 《中文研究》 2019年12期

摘要:
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27 007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。

信息运维协同团队管理支撑平台研究 下载:65 浏览:372

刘耀伟 王林 宋锐 颜佳 《国际科技论坛》 2018年5期

摘要:
随着信息技术特别是以大数据、云计算、物联网和移动互联为代表的新技术的涌现和快速发展,国网信息运维的工作量以及工作复杂程度大幅增加,资源整合效率日渐低下。本文针对信息运维处理流程不够规范、调控能力急需加强、各级各线队伍工作协同度不高以及主业业务运维能力不足等问题,提出了在原有运维团队的基础上以组建一体化的信息专业协同工作团队为出发点,构建全过程立体信息运维管理模式,并充分利用公司现有的技术平台,构建信息运维协同团队管理支撑平台。

基于上下文词向量和主题模型的实体消歧方法 下载:57 浏览:268

王瑞 李弼程 杜文倩 《中文研究》 2019年8期

摘要:
传统词向量训练模型仅考虑词共现而未考虑词序,语义表达能力弱。此外,现有实体消歧方法没有考虑实体的局部特征。综合实体的全局特征和局部特征,该文提出一种基于上下文词向量和主题模型的实体消歧方法。首先,在传统词向量模型上增加上下文方向向量,用于表征语序,并利用该模型与主题模型训练主题词向量;其次,分别计算实体上下文相似度、基于实体上下文主题的类别主题相似度以及基于主题词向量的实体主题相似度;最后,融合三种相似度,选择相似度最高的实体作为最终消歧实体。实验结果表明,相比于现有的主流消歧方法,新方法是有效的。

面向知识库问答的实体链接方法 下载:58 浏览:362

赵畅 李慧颖 《中文研究》 2019年7期

摘要:
面向知识库问答的实体链接是指将自然语言问句中实体指称链接到知识库中实体的方法。目前主要面临两个问题:第一是自然语言问句短,实体指称上下文不充分;第二是结构化知识库中实体的文本描述信息少。因此,该文提出了分别利用候选实体的类别、关系和邻近实体作为候选实体表示的方法,弥补知识库实体描述信息不足的问题。同时,通过语料训练得到问句指称的相似实体指称作为其背景知识。最后,结合实体流行度,共同作为实体消歧的特征。实验结果表明,上述提到所有特征的线性组合在数据集上高于单个特征的结果,表现最佳。

基于新HSK词汇大纲的词汇等级类推分析 下载:55 浏览:356

张引兵1,2 宋继华1 彭炜明1 郭冬冬1 张金1 《中文研究》 2019年3期

摘要:
HSK是一项国际汉语能力标准化考试。新HSK大纲中附表所列650个"默认词"多依据专家知识人工列举式的扩充。该文在《现代汉语词典》《现代汉语语法信息词典》等资源的基础上,利用知识工程的方法,迭代使用减字默认、组合默认等词汇等级类推规则,力争实现类推过程中隐性知识的显性化、分散知识的系统化,使得词汇等级类推的每一个环节都有章可循、有据可依,完成了基于新HSK大纲词汇等级的系统类推工作。接着,结合所构建的汉语词法知识库对类推结果进行了筛选,最终得到了23 762个词语的类推等级。最后,通过对类推结果的统计分析,表明该文的研究工作可以更好地发挥新HSK词汇大纲在汉语词汇定级、文本难度分级中的指导作用,也可为其他领域教学词汇大纲的制定提供一定的借鉴。

《现代汉语动词语义知识词典》的开发与应用 下载:57 浏览:501

孙道功1 亢世勇2 《中文研究》 2018年9期

摘要:
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。

基于语义分类和描述框架的网络攻击知识抽取研究及其应用 下载:48 浏览:344

方芳1,2 王亚1 王石1 符建辉1 曹存根1 《当代中文学刊》 2019年12期

摘要:
随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text,KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类和描述框架,它在现代汉语基本句模分类的基础上进行了扩充和改进。其次,重点介绍了攻击文本中最常见的遭受类语义类的设计和形成过程。然后将语义分类和描述框架应用在"网络安全"领域,形成"网络攻击语义类",并介绍在建立"网络攻击语义类"时遇到的难题,包括文法的设计中对事元的确定、复合句的处理、"的是"结构句型的分析设计、谓词设计等。最后,使用国家某安全部门提供的真实数据进行网络攻击知识抽取,实验表明该方法具有较高的准确率。

结合预训练模型和语言知识库的文本匹配方法 下载:46 浏览:329

周烨恒 石嘉晗 徐睿峰 《当代中文学刊》 2020年4期

摘要:
针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义—反义词汇知识学习任务和词组—搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习模型进行联合训练,以进一步提高模型性能。最后利用文本匹配标注数据进行微调。在MRPC和QQP两个公开数据集的实验结果显示,该方法可以在大规模预训练模型和微调的框架基础上,通过引入外部语言知识进行联合训练有效提升文本匹配性能。

基于知识图谱的无线电监测及盲信号识别 下载:42 浏览:258

张育瑜1,2 赵磊1 郭文彬1,2 彭涛1 王文博1 《无线电研究》 2020年7期

摘要:
针对无线电监测数据未规范化的问题,提出了基于知识图谱的海量无线电监测数据的分析思路,利用盲信号识别等方式,构建了结构化无线电监测数据知识库。可以去除无线电监测所产生的冗余信息,使无线电监测数据的存储更高效,并进一步实现智能可视化的无线电监测平台。实验结果表明,在完备的无线电监测知识库下,基于知识图谱构建的无线电监测平台能够实现盲信号的准确识别。

航空术语语义知识库辅助构建方法 下载:46 浏览:261

王思博 王裴岩 张桂平 《当代中文学刊》 2018年10期

摘要:
语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语语义知识库的方法。该方法根据航空术语的特点将辅助构建分成四个关键过程,构建了2 000条术语概念描述(DEF)。最后通过对人工标注的术语间相似度与根据术语DEF计算的术语间相似度结果的对比,验证了该构建方法的有效性。

融合多特征的基于远程监督的中文领域实体关系抽取 下载:72 浏览:403

王斌1 郭剑毅1 线岩团2 王红斌2 余正涛2 《人工智能研究》 2019年4期

摘要:
针对从未标记的文本中抽取中文领域实体关系的问题,文中提出基于远程监督的领域实体属性关系抽取的混合方法,利用知识库中已有结构化的关系三元组,从自然语言文本中自动获取训练语料.针对远程监督方法标注数据存在大量噪声的问题,采用隐含狄利克雷分布主题模型抽取主题关键词,再与关系类型进行相似度计算和对关键词模式匹配进行去噪.最后提取词性特征、依存关系特征和短语句法树特征,并进行融合,训练关系抽取模型.实验表明,3种特征融合的F值较高,抽取性能较好.

基于中医知识库的互联网医院智慧运营大脑建设探索 下载:111 浏览:1258

何海 陶苏丽 冷静 《当代中医药》 2024年1期

摘要:
探索互联网医疗建设过程中积累的成果和经验,结合中医知识库,通过云端数据融合、大数据分析和人工智能深度学习、区块链数据安全与隐私计算等技术,研究基于中医知识库的互联网医院智慧运营大脑的所需要的关键技术和应用服务,实现云端化大数据平台下的智能化医疗健康服务模式的创新。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享