请选择 目标期刊

基于神经网络的藏文正字检错法 下载:32 浏览:284

色差甲1 慈祯嘉措1 才让加1,2 华果才让1 《中文研究》 2020年9期

摘要:
在缺乏标注数据的条件下,该文将藏文正字检错任务视为一个分类问题:首先从语言学知识中构建音节混淆子集并给每个原句加噪,然后建立深层双向表征的BERT作为分类模型,最后为了证明该方法的有效性,构建两个基线模型和三种不同领域的测试集,实验结果表明,该方法的结果优于两个基线模型。该文方法在相同领域测试集上句子分类的正确率达到93.74%,不同领域测试集上也能达到83.6%。对错误音节的识别率为74.53%,同时对无错误音节的误判率只有2.30%。

基于循环卷积神经网络的藏文句类识别 下载:27 浏览:261

柔特1,2 才让加1,2 《中文研究》 2019年11期

摘要:
句子是语言的最小使用单位,句类识别是为了进一步细化句法和句义研究。由于藏文句尾通常没有特殊的标点符号来识别不同句类,因此这一藏文语言特性就变成了一大难题。该文提出了基于语境和功能特征为一体的句子用途分类方案。首先,该文介绍了文法中藏文句子分类及其特征。其次,收集了大量藏文句子并对其进行了人工标注。最后,采用循环卷积神经网络对藏文句类进行了自动识别。实验表明,该模型对藏文句类识别有较为显著的效果。

基于多源信息融合的分布式词表示学习 下载:25 浏览:441

冶忠林1,2,3,4 赵海兴1,2,3,4 张科1,3,4 朱宇1,3,4 《中文研究》 2019年6期

摘要:
分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足:(1)罕见词由于缺乏充分上下文训练数据,训练所得的罕见词向量表示不能充分地反映其在语料中的语义信息;(2)中心词语的反义词出现于上下文时,会使意义完全相反的词却赋予更近的空间向量表示;(3)互为同义词的词语均未出现于对方的上下文中,致使该类同义词学习得到的表示在向量空间中距离较远。基于以上三点,该文提出了一种基于多源信息融合的分布式词表示学习算法(MSWE),主要做了4个方面的改进:(1)通过显式地构建词语的上下文特征矩阵,保留了罕见词及其上下文词语在语言训练模型中的共现信息可以较准确地反映出词语结构所投影出的结构语义关联;(2)通过词语的描述或解释文本,构建词语的属性语义特征矩阵,可有效地弥补因为上下文结构特征稀疏而导致的训练不充分;(3)通过使用同义词与反义词信息,构建了词语的同义词与反义词特征矩阵,使得同义词在词向量空间中具有较近的空间距离,而反义词则在词向量空间中具有较远的空间距离;(4)通过诱导矩阵补全算法融合多源特征矩阵,训练得到词语低维度的表示向量。实验结果表明,该文提出的MSWE算法能够有效地从多源词语特征矩阵中学习到有效的特征因子,在6个词语相似度评测数据集上表现出了优异的性能。

藏文字同现网络的小世界效应和无标度特性 下载:19 浏览:201

才智杰1 孙茂松2 才让卓玛1 《中文研究》 2018年9期

摘要:
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。

一种基于TCLSTM的藏文词拼写检查方法 下载:39 浏览:299

华旦扎西1 才智杰2 班玛宝3 《当代中文学刊》 2020年8期

摘要:
拼写检查能够快速检测文本错误,提高文本校对效率,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。该文在分析藏文拼写检查技术和语言模型的基础上,以藏文词拼写检查为目标,选用具有长远距离记忆功能的LSTM建立TCLSTM语言模型,设计基于TCLSTM的藏文词拼写检查算法。经测试,基于TCLSTM语言模型的藏文词拼写检查取得了较好的效果。

基于描述约束的词表示学习 下载:78 浏览:493

冶忠林1,2,3 赵海兴1,4,2,3 张科4,2,3 朱宇4,2,3 《当代中文学刊》 2019年12期

摘要:
词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。

基于词性约束的藏文分词策略与算法 下载:28 浏览:330

才让卓玛1 才智杰2 《当代中文学刊》 2020年5期

摘要:
自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现状,提出基于词性约束的藏文分词策略与算法。相对于传统方法,该方法不仅能有效地预防和处理各类歧义现象,而且在藏文未登录词处理方面有较好表现。

基于PCFG的藏文疑问句句法分析 下载:43 浏览:365

班玛宝1,2,3 才智杰1,2,3 拉玛扎西1,2,3 《当代中文学刊》 2019年5期

摘要:
藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3%和97.4%,在开放测试集上的准确率、召回率和F1值分别达96.0%、95.4%和95.7%。

基于神经网络的藏语语音合成 下载:71 浏览:418

都格草才让卓玛 南措吉算太本 《当代中文学刊》 2019年5期

摘要:
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。

数字逻辑虚拟仿真实验教学课程建设与实践研究 下载:267 浏览:2907

王得芳 《国际科技论坛》 2022年1期

摘要:
本文介绍了数字逻辑虚拟仿真实验教学课程建设的主要知识点,综述了实验教学平台设计思想,分析了实验教学组成部分与方法,从应用角度出发,探究了仿真实验教学的具体实践活动,目的是提高我校的实验教学质量,也为今后开展这方面的研究提供参考。

青海高原医学论文信息检索与采编系统设计研究 下载:134 浏览:1667

刘丽丽 2023年4期

摘要:
高原医学主要研究人体在高原环境适应过程中发生的生理和病理变化,是一门具有发展性、综合性强的学科,在医学领域中有着举足轻重的地位。为满足互联网大数据信息查询的需要,我们开发了青海高原医学论文信息检索与采编系统,该系统采用Java语言、Springboot和MyBatista框架、MySQL数据库进行开发,实现了论文信息的采编、检索、排版与编辑等功能,以此科学有效的管理高原医学论文,提高广大用户使用参考论文文献的效率。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享