请选择 目标期刊

面向国防科技领域的技术和术语语料库构建方法 下载:25 浏览:353

冯鸾鸾 李军辉 李培峰 朱巧明 《中文研究》 2020年11期

摘要:
互联网存在海量的文献和科技信息,隐含着大量高价值情报。识别国防科技领域中的技术和术语可以为构建国防科技知识图谱奠定基础。该文基于此领域的海量军事文本,以维基百科中军事领域的新技术为基点采集语料,涵盖了新闻、文献和维基百科三种体裁。在分析军事技术文本特点的基础上制定了一系列标注规范,开展了大规模语料的标注工作,构建了一个面向国防科技领域的技术和术语语料库。该语料库共标注了479篇文章,包含24 487个句子和33 756个技术和术语。同时,该文探讨了模型预标注策略的可行性,并对技术和术语类别在不同体裁上的分布以及语料标注的一致性进行了统计分析。基于该语料库的实验表明,技术和术语识别性能F1值达到70.40%,为进一步的技术和术语识别研究提供了基础。

330MW机组低压缸零出力改造及热电特性分析 下载:34 浏览:315

史卫刚 李军辉 《中国电力技术》 2020年4期

摘要:
针对热电厂日益加剧的热电矛盾,机组灵活性和供热能力不足的问题,提出对某330 MW机组进行低压缸零出力的改造方案,介绍对汽轮机本体、低压通流部分冷却蒸汽系统和低压缸喷水减温系统的具体改造设计方案,分析机组改造前后的供热与调峰能力。通过性能试验,结果表明,通过合理地改造设计,低压缸零出力技术提高了机组的调峰能力和供热量,最大供热抽汽量可达663t/h,最低发电负荷可降至约80MW。

基于Transformer的AMR-to-Text生成 下载:37 浏览:280

朱杰 李军辉 《中文研究》 2020年5期

摘要:
抽象语义表示到文本(AMR-to-Text)的生成任务是给定AMR图,生成相同意义表示的文本。可以把此任务当成一个从源端AMR图到目标端句子的翻译任务。然而,传统的序列到序列(seq2seq, S2S)方法使用循环递归网络进行编码,并不能很好地解决长距离依赖的问题。当前最好的性能是图到序列(graph2seq, G2S)的模型,使用了图模型直接对AMR图结构进行编码,但是,该方法对于非直接相连的节点依然会损失大量的结构信息。针对上述问题,基于seq2seq框架,该文提出了一种直接而有效的AMR-to-Text生成方法。在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(BPE)和共享词表的方法来联合处理未登录词(OOV)的问题。在现有的两份英文标准数据集上,实验结果都得到了显著的提升,达到了新的最高性能。

基于枢轴语言的图像描述生成研究 下载:47 浏览:429

张凯 李军辉 周国栋 《当代中文学刊》 2019年7期

摘要:
当前图像描述生成的研究主要仅限于单语言(如英文),这得益于大规模的已人工标注的图像及其英文描述语料。该文探索零标注资源情况下,以英文作为枢轴语言的图像中文描述生成研究。具体地,借助于神经机器翻译技术,该文提出并比较了两种图像中文描述生成的方法:(1)串行法,该方法首先将图像生成英文描述,然后由英文描述翻译成中文描述;(2)构建伪训练语料法,该方法首先将训练集中图像的英文描述翻译为中文描述,得到图像-中文描述的伪标注语料,然后训练一个图像中文描述生成模型。特别地,对于第二种方法,该文还比较了基于词和基于字的中文描述生成模型。实验结果表明,采用构建伪训练语料法优于串行法,同时基于字的中文描述生成模型也要优于基于词的模型,BLEU4值达到0.341。

大剂量奥曲肽分别联合兰索拉唑、奥美拉唑治疗肝硬化并上消化道出血的效果比较 下载:34 浏览:366

许晓虹 李军辉 史智英 《中国医学研究》 2020年4期

摘要:
目的比较大剂量奥曲肽分别联合兰索拉唑、奥美拉唑治疗肝硬化并上消化道出血的效果。方法回顾性分析我院收治的157例肝硬化并上消化道出血患者的临床资料,其中采用大剂量奥曲肽联合兰索拉唑治疗者79例,设为A组;采用大剂量奥曲肽联合奥美拉唑治疗者78例,设为B组。比较两组的治疗效果。结果治疗后3 d,两组的胃液pH及血红蛋白水平均升高,且A组高于B组(P<0.05)。A组的止血时间短于B组(P<0.05)。A组的治疗总有效率高于B组(P<0.05)。结论大剂量奥曲肽联合兰索拉唑治疗肝硬化并上消化道出血,更利于改善患者的胃液pH和血红蛋白水平,缩短出血时间,提高治疗效果。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享