中文研究
中文研究
《中文研究》系开放获取期刊,本刊旨在为从事语言文字研究的教学、科研工作者及语言文字爱好者提供优秀的精神产品。以传承文明,传承学术为使命,提倡学术创新,反映国内外本学科的最新研究成果。以繁荣人文社会科学研究,服务学科建设与发展,提升社会精神文明生态为办刊方针。

ISSN: 3007-9896

《中文研究》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。



提示文字!

注:我们将于1~7个工作日告知您审稿结果,请耐心等待;

您也可以在官网首页点击“查看投稿进度”输入文章题目,查询稿件实时进程。


  • 近代学校音乐教育背景下的学堂乐歌——以白话新诗的发生为考察维度 下载:56 浏览:430
  • 谢君兰 《中文研究》 2020年12期
  • 摘要:
    白话新诗的发生存在丰富的整合维度,在近代学校音乐背景下诞生的学堂乐歌是其中极具诗体价值的部分。这些乐歌将古典诗歌元素、译介词汇元素与儿童歌谣等丰富的语言形态都整合到音乐旋律的麾下,如果从新诗视角加以考察,其实就是对多重语言资源的自然吸纳。从作者心态和时代思想环境看,这一语言特征与词作者平和从容的抒写状态紧密相关,也得益于乐歌歌词对于当时文学文类格局以及"历史进化论"的有效规避;从读者来看,乐歌在学校场合的集体演唱,则逐渐影响到学生对音乐乃至诗歌语言的基本认知与审美趣味,酝酿了新诗读者在白话文层面的语言习惯。
  • 被忽略的颓废主义诗人朱维基 下载:43 浏览:331
  • 李朝平 《中文研究》 2020年12期
  • 摘要:
    中国新诗中的颓废主义一脉向来乏人问津,职是之故,以翻译而著称的朱维基,其颓废主义的诗歌实践便长期被湮没。为了敞现中国现代主义诗歌中实存的颓废面向,在厘清颓废主义概念的基础上,本文从"绿社"的理念主张入手逐渐走近朱维基,首先辨析了他所承受的西方影响,然后从官能描绘、身体主题以及死亡书写等方面对其诗歌的颓废特质予以重点探究。此项个案研究旨在表明,颓废主义是中国现代主义诗歌中的重要一翼,只有充分意识到它的存在,才能将现代主义诗歌的研究推向深入。
  • 基于长时间跨度语料的词义演变计算研究 下载:22 浏览:370
  • 孙琦鑫1,2 饶高琦1,2,3 荀恩东1,2 《中文研究》 2020年12期
  • 摘要:
    该文收集了自晚清到21世纪间长达144年的连续历时报刊语料,通过统计分析和词语分布式表示两类方法展开研究,计算并辅助识别汉语词语的词义历时演变现象。采用TF-IDF、词频比例等多种统计分析的评价指标和目标词语在文段中的共现实词及其重合度挖掘出现词义演变的词语。针对历时语料上不同时间段的词向量对齐,采用SGNS训练词向量加正交矩阵投影、SGNS递增训练和"锚点词"二阶词向量表示三种方法,其中以SGNS递增训练效果最佳。针对自动发现的词义演变现象,采用目标词历时自相似度和锚点词历时相似度的分析方法,并利用近邻词来明确目标词变迁前后的词义。
  • 基于平行周遍原则的汉语未登录词的知识表示与预测 下载:52 浏览:325
  • 康司辰1 虞梦夏1,2 刘扬1 《中文研究》 2020年12期
  • 摘要:
    汉语未登录词的知识表示与预测,包括词性、构词结构、词义等项目,是计算语言学领域中的基础性问题。该文依据"平行周遍"原则,从现有的语义构词知识中提取"平行条件",将未登录词潜在的构词因素与这些"平行条件"进行适应性匹配,从而对其知识表示进行相对完整的预测。该方法将新的语言学理论与未登录词的理解应用问题结合,取得了显著的效果,其解释能力、便捷性和精细程度优于此前方法。这些研究,除了在自然语言处理领域有实用价值,也有望推动词典编撰、语言研究与教学等人文领域的进展。
  • 汉语委婉语语言资源建设 下载:32 浏览:417
  • 张辰麟1 王明文1 谭亦鸣2 肖文艳1 《中文研究》 2020年12期
  • 摘要:
    委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63 000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。
  • 面向国防科技领域的技术和术语语料库构建方法 下载:25 浏览:353
  • 冯鸾鸾 李军辉 李培峰 朱巧明 《中文研究》 2020年11期
  • 摘要:
    互联网存在海量的文献和科技信息,隐含着大量高价值情报。识别国防科技领域中的技术和术语可以为构建国防科技知识图谱奠定基础。该文基于此领域的海量军事文本,以维基百科中军事领域的新技术为基点采集语料,涵盖了新闻、文献和维基百科三种体裁。在分析军事技术文本特点的基础上制定了一系列标注规范,开展了大规模语料的标注工作,构建了一个面向国防科技领域的技术和术语语料库。该语料库共标注了479篇文章,包含24 487个句子和33 756个技术和术语。同时,该文探讨了模型预标注策略的可行性,并对技术和术语类别在不同体裁上的分布以及语料标注的一致性进行了统计分析。基于该语料库的实验表明,技术和术语识别性能F1值达到70.40%,为进一步的技术和术语识别研究提供了基础。
  • 利用门控机制融合依存与语义信息的事件检测方法 下载:52 浏览:345
  • 陈佳丽 洪宇 王捷 张婧丽 姚建民 《中文研究》 2020年11期
  • 摘要:
    句子级事件检测任务目的是识别和分类事件触发词。现阶段工作主要将句子作为神经分类网络的输入,学习句子的深层语义信息,从而优化句子表示来改进事件检测任务的性能。该文发现除句子语义信息外,依存树包含的句法结构信息也有助于获取准确的句子表示。为此,该文采用双向长短时记忆网络对句子进行编码,捕获其语义信息;同时,设计图神经网络对句子的依存结构进行表示,获取其依存信息;此外,在对句子进行语义编码与依存编码时,该文利用自注意力机制使模型选择性地关注句子中的不同词,从而捕获句子中有助于事件检测的关键信息,并尽可能避免无关词的干扰;最后,该文提出门控机制,通过加权实现上述两种信息的动态融合。该文在自动文本抽取(automatic content extraction, ACE)数据集上进行实验,结果显示,该文提出的动态融合语义信息与依存信息的方法能更加有效地对句子进行编码,并捕获句子中的事件信息,在触发词识别与事件类型分类这两个子任务中,F1值均有较大提升,分别达到76.3%和73.9%。
  • 用于社交媒体的中文命名实体识别 下载:60 浏览:233
  • 李源 马磊 邵党国 袁梅宇 张名芳 《中文研究》 2020年11期
  • 摘要:
    社交领域的中文命名实体识别(NER)是自然语言处理(NLP)中一项重要的基础任务。目前基于词粒度信息或者外部知识的中文命名实体识别方法,都会受到中文分词(CWS)和溢出词(OOV)等问题的影响。因此,该文提出了一种基于字符的使用位置编码和多种注意力的对抗学习模型。联合使用位置编码和多头注意力能够更好地捕获字序间的依赖关系,而使用空间注意力的判别器则能改善对外部知识的提取效果。该文模型分别在Weibo2015数据集和Weibo2017数据集上进行了实验,实验结果中的F1值分别为56.79%和60.62%。与多个基线模型相比,该文提出的模型性能更优。
  • 融合空洞卷积神经网络与层次注意力机制的中文命名实体识别 下载:24 浏览:479
  • 陈茹1,2 卢先领2,3 《中文研究》 2020年11期
  • 摘要:
    该文针对现有的命名实体识别(named entity recognition,NER)模型未考虑到文本层次化结构对实体识别的重要作用,以及循环神经网络受其递归性的限制导致计算效率低下等问题,构建了IDC-HSAN模型(Iterated Dilated Convolutions Neural Networks and Hierarchical Self-attention Network)。该模型通过迭代的空洞卷积神经网络(ID-CNN)充分利用GPU的并行性大大降低了使用长短时记忆网络的时间代价。然后,采用层次化注意力机制捕获重要的局部特征和全局上下文中的重要语义信息。此外,为了丰富嵌入信息,加入了偏旁部首信息。最后,在不同领域数据集上的实验结果表明,IDC-HSAN模型能够从文本中获取有用的实体信息,和传统的深度网络模型、结合注意力机制的命名实体识别模型相比识别效果有所提升。
  • 基于HRED模型的中文多轮对话任务方法研究 下载:54 浏览:319
  • 王孟宇 俞鼎耀 严睿 胡文鹏 赵东岩 《中文研究》 2020年11期
  • 摘要:
    多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级的循环神经网络来编码上下文信息,并在Movie-DiC等英文对话数据集上取得了不错的结果。在2018年京东举办的中文多轮对话大赛中,京东向参赛选手公布了一批高质量的真实客服对话语料。该文在此数据上进行实验,针对HRED模型的缺点以及在中文语料下的表现进行改进,提出基于注意力和跨步融合机制与HRED模型结合的方案,实验结果表明,该方案取得了较大的性能提升。
  • 卷积重提取特征的文档列表排序学习方法 下载:30 浏览:205
  • 曹军梅 马乐荣 《中文研究》 2020年10期
  • 摘要:
    在许多信息检索任务中,为了进一步提高检索性能,通常需要对检索到的文档进行重新排序,目前的排序学习方法主要集中在损失函数的构造上,而没有考虑特征之间的关系。该文将多通道深度卷积神经网络作用于文档列表排序学习方法,即ListCNN,实现了信息检索的精确重排序。由于从文档中提取的多个特征中有一些特征具有局部相关性和冗余性,因此,文中使用卷积神经网络来重新提取特征,以提高列表方法的性能。ListCNN架构考虑了原始文档特征的局部相关性,能够有效地重新提取代表性特征。在公共数据集LETOR 4.0上对ListCNN进行实验验证,结果表明其性能优于已有文档列表方法。
  • 基于粗糙集和多通道词向量的中文文本情感特征分析 下载:42 浏览:366
  • 陈波1 谢珺1 苗夺谦2 王雨竹1 续欣莹3 《中文研究》 2020年10期
  • 摘要:
    粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法。利用粗糙集决策表对整个语料库进行情感词特征建模,采用Johnson粗糙集属性约简算法对决策表进行化简,保留最小的文本情感词特征属性集,之后再对该集合中的所有情感特征词进行词嵌入表示,最后用逻辑回归分类器验证RS-WvGv方法的有效性。另外,该文还定义了情感词特征属性集覆盖力,用于表示文本情感词特征属性集合对语料库的覆盖能力。最后,在实验对比的过程中,用统计检验进一步验证了该方法的有效性。
  • 基于对话结构和联合学习的情感和意图分类 下载:42 浏览:237
  • 张伟生 王中卿 李寿山 周国栋 《中文研究》 2020年10期
  • 摘要:
    在社交媒体中存在大量的对话文本,而在这些对话中,说话人的情感和意图通常是相关的。不仅如此,对话的整体结构也会影响对话的情感和意图,因此,需要对对话中的情感和意图进行联合学习。为此,该文提出了基于对话结构的情感、意图联合学习模型,考虑对话内潜在的情感与意图的关联性,并且利用对话的内在结构与说话人的情感和意图之间的关系,提升多轮对话文本的每一子句情感及其意图的分类性能。同时,通过使用注意力机制,利用对话的前后联系来综合考虑上下文对对话情感的影响。实验表明,联合学习模型能有效地提高对话子句情感及意图分类的性能。
  • 立场分析研究综述 下载:57 浏览:263
  • 刘玮1 彭鑫2 李超1 王品2 王丽宏1 《中文研究》 2020年10期
  • 摘要:
    随着以微博、Twitter为代表的社交媒体的快速发展,越来越多的用户喜欢在网上浏览热点信息,并发表自己的观点。立场分析旨在挖掘用户对特定目标或主题(例如,事件、产品、政策、人物或者服务等)的支持、反对或者中立的态度,该研究对舆情监管、信息推荐等具有重要意义。该文对立场分析研究开展综述,从立场分析定义,基于机器学习、深度学习及迁移学习的立场分析方法,使用的数据集三方面分别进行概述,并对未来的研究方向进行展望。
  • 知识图谱研究现状及军事应用 下载:57 浏览:327
  • 林旺群1 汪淼1 王伟1 王重楠1 金松昌2 《中文研究》 2020年10期
  • 摘要:
    知识图谱以语义网络的形式将客观世界中概念、实体及其之间的关系进行结构化描述,提高了人类从数据中抽取信息、从信息中提炼知识的能力。该文形式化地描述了知识图谱的基本概念,提出了知识图谱的层次化体系架构,详细分析了信息抽取、知识融合、知识架构、知识管理等核心层次的技术发展现状,系统梳理了知识图谱在军事领域的应用,并对知识图谱未来发展的挑战和趋势进行了总结展望。
  • 基于层次分析法的汉语词汇综合复杂度量化分析 下载:50 浏览:322
  • 张引兵1,2 宋继华1 彭炜明1 郭冬冬1 宋天宝1 《中文研究》 2020年9期
  • 摘要:
    在国际汉语教学中,词汇综合复杂度的量化研究有利于汉语二语学习者词汇习得顺序的确定,有利于教材编写过程中词汇的选择,有利于教师更加有效地组织课堂教学,最终提高教学效果。该文在对词汇的构词汉字属性、词汇一般属性、词汇统计属性等特征进行分析的基础上,构造了基于层次分析法(analytic hierarchy process, AHP)的汉语词汇综合复杂度量化模型,并将其应用于所研究词汇综合复杂度的量化分析。通过将实验结果与已有大纲词汇分级一致性的对比分析,验证了该研究词汇综合复杂度量化模型的合理性,为词汇综合复杂度的量化分析提供了定性与定量相结合的分析方案,同时也为词汇分级、文本难度分析、文本简化等提供了借鉴。
  • 基于篇章主题的中文宏观篇章主次关系识别方法 下载:40 浏览:232
  • 孙振华 周懿 朱巧明 蒋峰 李培峰 《中文研究》 2020年9期
  • 摘要:
    篇章分析是自然语言处理领域研究的热点和重点。作为篇章分析的任务之一,篇章主次关系研究篇章的主要和次要内容,从而更好地理解和把握篇章的核心内容。该文重点研究宏观领域的中文篇章主次关系,提出了一种基于篇章主题的中文宏观篇章主次关系识别方法。该方法利用篇章单元间、篇章单元与篇章主题间的语义交互来识别主次关系,并有选择地应用篇章主题信息,有效提高了主次关系核心的识别。在中文宏观汉语篇章树库(MCDTB)上的实验结果显示,该方法优于目前性能最好的基准系统。
  • 面向中朝跨语言文本分类的双语主题词嵌入模型的研究 下载:36 浏览:382
  • 王琪 田明杰 崔荣一 赵亚慧 《中文研究》 2020年9期
  • 摘要:
    针对日渐丰富的少数民族语言资源进行管理、研究和使用有着重要的应用价值。为了解决语言差异引起的语言鸿沟,针对中朝两种语言环境下的跨语言文本分类任务,提出了双语主题词嵌入模型。该文将词嵌入模型与主题模型扩展到双语环境,并将两种模型相结合,解决了歧义性对跨语言文本分类精度带来的影响。首先,在大规模单词级别对齐平行句对中训练中朝单词的词嵌入向量;其次,利用主题模型对中朝分类语料进行表示,并获得中朝单词的含有主题信息的词嵌入向量;最后,将中朝单词的主题词嵌入向量输入至文本分类器,进行模型的训练与分类预测。实验结果表明,中朝跨语言文本分类任务的准确率达到了91.76%,已达到实际应用的水平,同时该文提出的模型可以对一词多义单词的多个词义有很好的表示。
  • 基于神经网络的藏文正字检错法 下载:32 浏览:281
  • 色差甲1 慈祯嘉措1 才让加1,2 华果才让1 《中文研究》 2020年9期
  • 摘要:
    在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。
  • 部首感知的中文医疗命名实体识别 下载:69 浏览:435
  • 李丹1,2 徐童1,2 郑毅3王喆锋3 陈恩红1,2 《中文研究》 2020年9期
  • 摘要:
    人工智能技术的发展推动了医疗领域的智能化,为提升医疗效率、改善医疗水平提供了新的助力。同时,这一新的趋势也催生了海量的电子病历文本,其所蕴含的丰富信息具有巨大的潜在挖掘与应用价值。然而,当前中文电子病历的命名实体识别研究工作并没有全面考虑中文及中文医疗领域的特殊性,而是将面向通用数据集的模型迁移到医疗领域的实体类型中,分析效果较为有限。针对这一问题,该文设计了长短期记忆网络与条件随机场的联合模型并引入BERT模型;在此基础之上,考虑到医疗领域命名实体鲜明的部首特征,通过将部首信息编码到字向量中,并且结合部首信息修改条件随机场层得分函数的计算方式,有效地提升了医疗领域命名实体的抽取能力。通过两项电子病历数据集的实验结果表明,该文提出的模型整体效果略高于通用的实体识别模型,并对疾病诊断等特定类型的实体词的识别效果具有较为明显的提升。
加入编委加入审稿人
中文研究  期刊指标
出版年份 2018-2025
发文量 689
访问量 130587
下载量 39862
总被引次数 406
影响因子 1.192
为你推荐