中文研究
中文研究
《中文研究》系开放获取期刊,本刊旨在为从事语言文字研究的教学、科研工作者及语言文字爱好者提供优秀的精神产品。以传承文明,传承学术为使命,提倡学术创新,反映国内外本学科的最新研究成果。以繁荣人文社会科学研究,服务学科建设与发展,提升社会精神文明生态为办刊方针。

ISSN: 3007-9896

《中文研究》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。



提示文字!

注:我们将于1~7个工作日告知您审稿结果,请耐心等待;

您也可以在官网首页点击“查看投稿进度”输入文章题目,查询稿件实时进程。

  • 神经机器翻译中数据泛化与短语生成方法研究 下载:43 浏览:391
  • 李强1 韩雅倩1 肖桐1,2 朱靖波1,2 《中文研究》 2018年3期
  • 摘要:
    该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。
  • 大规模中文实体情感知识的自动获取 下载:52 浏览:406
  • 卢奇1,2 陈文亮1,2 《中文研究》 2018年3期
  • 摘要:
    目前中文情感分析的主要资源以情感词典为主,缺乏针对实体或属性的情感知识资源。该文主要研究如何从大规模文本语料中自动获取实体情感知识。在该文方法中,用情感表达组合来表示实体情感知识。首先,基于二部图排序算法对情感表达组合候选集合进行排序。然后,提出了一种基于语义相似的提炼算法对于排序靠后的表达组合进行选择。在提炼选择过程中,充分考虑实体之间和情感词之间的约束。最后,该文在三种大规模不同领域的语料上进行实验,并进行人工评价。评价结果表明,从三个领域数据集上获取的实体情感表达组合正确率均高于90%。最终我们获得了一个大规模情感知识词典,包括约30万对的情感表达组合。
  • 基于统计和词典方法相结合的韩汉双语语料库名词短语对齐 下载:61 浏览:402
  • 凌天斌 毕玉德 《中文研究》 2018年3期
  • 摘要:
    韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的词对齐方法进行试验分析的基础上,提出了基于词对齐位置信息的韩汉双语语料库名词短语对齐方法。该方法通过基于统计的方法获得词对齐位置信息,在此基础上利用基于词典方法的相似度计算进行词对齐校正;根据以上结果,该文通过韩国语名词短语左右边界规则抽取名词短语及其汉语译文,利用关联度度量方法进行过滤,实现名词短语对齐。实验结果表明,在较大规模语料库情况下,该方法取得了较好的短语对齐结果。
  • 中文嵌套命名实体识别语料库的构建 下载:66 浏览:359
  • 李雁群1,2 何云琪1,2 钱龙华1,2 周国栋1,2 《中文研究》 2018年3期
  • 摘要:
    嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命名实体语料库。首先利用已有中文命名实体语料库中的标注信息自动地构造出尽可能多的嵌套命名实体,然后再进行手工调整以满足对中文嵌套实体的标注要求,从而构建高质量的中文嵌套命名实体识别语料库。语料内和跨语料嵌套实体识别的初步实验表明,中文嵌套命名实体识别仍是一个比较困难的问题,需要进一步研究。
  • 基于包含度和频繁模式的文本特征选择方法 下载:38 浏览:345
  • 池云仙1,2 赵书良2 李仁杰1 《中文研究》 2018年2期
  • 摘要:
    大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。"基于模式"特征选择方法具有传统"基于词语"方法所没有的优越特性,可以进行有效地信息去噪,提升文本挖掘性能。该文提出基于包含度和频繁模式的文本特征选择方法:首先,定义基于包含度的相似性度量原理;然后,提出基于包含度的冗余文本频繁模式过滤方法。基于包含度度量文本频繁模式间相似性,以此去除子模式及相似度较高的交叉模式。再通过冗余模式去噪,提升文本频繁模式挖掘性能;提出基于关联度的文本特征选择方法。以经过过滤处理后的非冗余文本频繁模式为基础,进行文本特征选择,并利用词语与文档的关联度进行词语类别划分及权重分配。使所选特征与文档关联度更加清晰,分类效果更好。通过在数据集Reuters-21578上的实验得知,基于包含度和频繁模式的文本特征选择算法性能,优于当前普遍应用的传统文本特征选择方法和新的特征选择及特征抽取方法。
  • 基于Bi-tagged特征的维吾尔文情感分类方法研究 下载:55 浏览:412
  • 热西旦木·吐尔洪太1,2 吾守尔·斯拉木1 《中文研究》 2018年2期
  • 摘要:
    现有的维吾尔文文本情感分类方法以从空格分词中得到的unigram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象。该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特征,并基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类。实验结果表明,在维吾尔文文本情感分类中:(1)当包含该文提出的各项词性规则时,Bi-tagged特征的性能最优;(2)Bi-tagged特征不仅能够提取情感丰富的信息,而且可以提取否定信息;(3)与常用的unigram、bigram特征以及unigram和bigram的组合特征在该文数据集上的分类效果相比,该文所提取的Bi-tagged与unigram的组合特征分类效果更佳,比该文的Baseline的分类准确率提高了4.225%。该研究成果不但可以进一步提高维吾尔文文本情感分类效率,也可为哈萨克语、柯尔克孜语等亲属语言的情感分类提供借鉴。
  • 哈萨克语句法分析辅助特征提取研究 下载:63 浏览:278
  • 陈雪古丽拉·阿东别克 《中文研究》 2018年2期
  • 摘要:
    在哈萨克语句法分析中,该文用平均感知器算法训练句法分析模型,用柱搜索算法进行解码,可以快速准确地对哈萨克语句子进行短语结构句法分析。在解析句子过程中,构建了一个双向LSTM模型,利用它提取句子中每个单词之间组成结构的信息,以预测每个单词在句法树中的句法组成部分,然后将结果作为辅助前瞻特征传递给句法分析过程。实验证明,此方法与基线模型相比,在准确率和召回率上均有提高。
  • 基于门控循环神经网络词性标注的蒙汉机器翻译研究 下载:68 浏览:442
  • 刘婉婉 苏依拉乌尼尔仁庆道尔吉 《中文研究》 2018年2期
  • 摘要:
    统计机器翻译可以通过统计方法预测出目标词,但没有充分理解原文语义关系,因而得到的译文质量不高。针对该问题,利用一种基于门控单元循环神经网络结构来对蒙汉神经机器翻译系统进行建模,引入注意力机制来获取双语词语的对齐信息,并在构建字典过程中对双语词语进行词性标注来强化语义,以此来缓解因欠训练导致的错译问题。实验结果表明,与RNN的基准系统和传统的统计机器翻译方法相比,该方法 BLEU值得到一定的提升。
  • 基于RNN和CNN的蒙汉神经机器翻译研究 下载:62 浏览:429
  • 包乌格德勒1,2 赵小兵2 《中文研究》 2018年2期
  • 摘要:
    该文探讨了基于RNN和CNN的蒙汉神经机器翻译模型,分别采用蒙古语的词模型、切分模型和子词模型作为翻译系统的输入信号,并与传统的基于短语的SMT进行了比较分析。实验结果表明,子词模型可以有效地提高RNN NMT和CNN NMT的翻译质量。同时实验结果也表明,基于RNN的蒙汉NMT模型的翻译性能已经超过传统的基于短语的蒙汉SMT模型。
  • 面向商品评论的二元情感认知模型 下载:76 浏览:392
  • 陈放 王颗 梁爽 黄永峰 《中文研究》 2018年1期
  • 摘要:
    该文提出了一种面向商品评论的二元情感认知模型。该模型由"二元情感常识库"、"评价体系知识库"和"情感分析引擎"三个主要模块组成。其特点体现为:(1)模型通过大规模评论文本学习领域先验知识,将其存储在知识库中,便于知识的修正和重用,体现了模型的认知能力;(2)模型不仅能够挖掘评论文本中出现的显式评价观点,还能借助领域知识进行情感推断,发现更高层次的用户情感。该文给出了构建"二元情感常识库"和"评价体系知识库"的相关算法,并介绍了"情感分析引擎"在观点挖掘和情感推断中的应用。在商品评论语料集上的实验验证了该模型的有效性。
  • 基于协同过滤Attention机制的情感分析模型 下载:47 浏览:433
  • 赵冬梅1,2 李雅2 陶建华2 顾明亮1 《中文研究》 2018年1期
  • 摘要:
    该文主要研究在评论性数据中用户个性及产品信息对数据情感类别的影响。在影响数据情感类型的众多因素中,该文认为评价的主体即用户以及被评价的对象等信息对评论数据的情感至关重要。该文提出一种基于协同过滤Attention机制的情感分析方法(LSTM-CFA),使用协同过滤(CF)算法计算出用户兴趣分布矩阵,再将矩阵利用SVD分解后加入层次LSTM模型,作为模型注意力机制提取文档特征、实现情感分类。实验表明LSTMCFA方法能够高效提取用户个性与产品属性信息,显著提升了情感分类的准确率。
  • 传播源估计中有效观察点部署策略研究 下载:82 浏览:473
  • 刘栋1,2 赵婧1 聂豪1 《中文研究》 2018年1期
  • 摘要:
    谣言或疾病的扩散均可模拟为传播源在网络中的传播,如何在网络中估计传播源位置是一项具有挑战性的任务。该任务往往根据部分观察点推断传播源的位置,故如何有效的选择观察点对准确定位传播源位置至关重要。该文分析了随机、度、聚类系数、特征向量、紧密度以及介数等观察点部署策略对传染源估计的影响。在实验中,采用SI传播模型和反向贪心算法估计传播源在三类合成网络和四个真实网络进行模拟仿真,实验结果表明采用特征向量的观察点部署策略更有利于提高传播源估计的精度。
  • 面向复杂有权网络的社区发现方法研究 下载:58 浏览:308
  • 谭红叶1 吴永科1 张虎1 刘全明1 李茹1,2 《中文研究》 2018年1期
  • 摘要:
    复杂网络中节点之间的连接强度会在很大程度上影响网络的社区结构,利用权重来刻画连接强度的差异性,并将其应用到社区发现研究中具有重要的意义。针对目前有权网络的社区发现方法存在的不足,该文结合节点的直接连边权重和基于共同邻居节点的连边权重,提出了一种改进的节点相关度度量准则。进一步基于这种改进的节点相关度度量准则和团体之间的聚集方法,构建了面向有权网络的社区发现模型。分别在有权值的科学家合作网络和全国列车网络数据集上进行了社区发现实验,结果表明了方法的有效性。
  • 类比社交网络的进程故障检测方法研究 下载:71 浏览:381
  • 程自强1 黄荣2 杨洋1 《中文研究》 2018年1期
  • 摘要:
    我们周围充满了各种网络;按照相似的内在机理,可以将它们分为物理网络和信息网络。对于具有明显物理特征的网络,我们可以运用物理常识解释其内部结构或节点的性质;而对于信息网络,我们往往需要结合一些先验知识去理解,社交网络正是这样一个例子。然而,对于那些并非具有显著物理或社交背景的网络,以往并没有明确的分析思路和方法。该文将尝试运用类似于分析社交网络的方法去分析电信CSB业务系统服务器集群上的进程网络;具体地预测进程网络中节点的崩溃(故障)状态。在这个特定的进程网络上,这种建模和分析思路得到了较为可信的结果;研究表明,进程节点的运行信息(如CPU和内存使用率)、进程间的通信情况以及进程节点在整个网络中的结构特征对于判断该节点的状态具有一定的指导价值,而上述特征在时间维度上的变化量同样反映了进程/端口的状态。
加入编委加入审稿人
中文研究  期刊指标
出版年份 2018-2025
发文量 689
访问量 130587
下载量 39862
总被引次数 406
影响因子 1.192
为你推荐