请选择 目标期刊

基于原型网络的细粒度实体分类方法 下载:48 浏览:352

任权 《中文研究》 2020年8期

摘要:
细粒度实体分类任务作为命名实体识别任务的扩展,其目的是根据指称及其上下文,发掘实体更细粒度的类别含义。由于细粒度实体语料的标注代价较大,标注错误率较高,因此该文研究了在少量样本情况下的细粒度实体分类方法。该文首先提出了一种特征提取模型,能够分别从单词层面以及字符层面提取实体信息,随后结合原型网络将多标签分类任务转化为单标签分类任务,通过缩小空间中同类样本与原型的距离实现分类。该文使用少样本学习以及零样本学习两种设置在公开数据集FIGER(GOLD)上进行了实验,在少样本学习的设置下,较基线模型在三个指标中均有提升,其中macro-F1的提升最大,为2.4%。

基于用电信息采集系统的反窃电风险评估研究与应用 下载:71 浏览:421

赵俊鹏1 吕孟玉2 张洋瑞1 张冰玉1 李晶1 段子荷1 《中国电力技术》 2019年3期

摘要:
窃电的多样性与反窃电成本的逐步提高,给供电企业的反窃电工作带来了巨大的挑战。介绍了一种综合贝叶斯分类算法与聚类算法的分析研究方法,通过对与窃电相关的事件进行特征值赋予,并根据关联关系编制了一套窃电概率值评价体系,实现了对窃电嫌疑用户进行窃电概率评估。该方法可精准定位窃电现场,提升窃电用户查处的效率,改善社会用电环境。

基于联合学习的问答情感分类方法 下载:42 浏览:310

安明慧1 沈忱林1 李寿山1 李逸薇2 《中文研究》 2019年4期

摘要:
面向问答型评论的情感分类在情感分析领域是一项新颖且极具挑战性的研究任务。由于问答型评论情感分类标注数据非常匮乏,基于监督学习的情感分类方法的性能有一定限制。为了解决上述困境,该文提出了一种基于联合学习的问答情感分类方法。该方法通过大量自然标注普通评论辅助问答情感分类任务,将问答情感分类作为主任务,将普通评论情感分类作为辅助任务。具体而言,首先通过主任务模型单独学习问答型评论的情感信息;其次,使用问答型评论和普通评论共同训练辅助任务模型,以获取问答型评论的辅助情感信息;最后通过联合学习同时学习和更新主任务模型及辅助任务模型的参数。实验结果表明,基于联合学习的问答情感分类方法能较好融合问答型评论和普通评论的情感信息,大幅提升问答情感分类任务的性能。

基于小波分析的特征提取文本分类方法研究 下载:61 浏览:331

朱晋1 怀丽波1 崔荣一1 尹慧2 《中文研究》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

基于Bi-tagged特征的维吾尔文情感分类方法研究 下载:55 浏览:416

热西旦木·吐尔洪太1,2 吾守尔·斯拉木1 《中文研究》 2018年2期

摘要:
现有的维吾尔文文本情感分类方法以从空格分词中得到的unigram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象。该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特征,并基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类。实验结果表明,在维吾尔文文本情感分类中:(1)当包含该文提出的各项词性规则时,Bi-tagged特征的性能最优;(2)Bi-tagged特征不仅能够提取情感丰富的信息,而且可以提取否定信息;(3)与常用的unigram、bigram特征以及unigram和bigram的组合特征在该文数据集上的分类效果相比,该文所提取的Bi-tagged与unigram的组合特征分类效果更佳,比该文的Baseline的分类准确率提高了4.225%。该研究成果不但可以进一步提高维吾尔文文本情感分类效率,也可为哈萨克语、柯尔克孜语等亲属语言的情感分类提供借鉴。

面向问答文本的属性分类方法 下载:56 浏览:350

江明奇 沈忱林 李寿山 《当代中文学刊》 2019年10期

摘要:
属性分类是属性级情感分析中的一个重要任务。该任务旨在对文本包含的某些具体属性进行自动分类。已有的属性分类方法研究基本都是面向新闻、评论等文本类型。与已有研究不同的是,该文的研究主要面向问答文本的属性分类任务。针对问答文本的属性分类问题,该文提出了一种多维文本表示的方法。首先,该方法进行中文句子切分;其次,使用LSTM模型对每个子问题和答案学习一个隐层表示;再其次,通过融合多个隐层表示,形成多维文本表示;最后,使用卷积层处理多维文本表示,获得最终分类结果。实验结果表明该方法明显优于传统的属性分类方法。

基于隐含主题协同注意力网络的领域分类方法 下载:37 浏览:356

黄培松 黄沛杰 丁健德 艾文程 章锦川 《当代中文学刊》 2020年4期

摘要:
基于注意力机制的神经网络模型在文本分类任务中显示出了很好的效果。然而当训练数据的规模有限,或者测试数据与训练数据的分布有较大差异时,一些有价值的信息词很难在训练中被模型捕捉到。为此,该文提出了一种新的基于协同注意力(co-attention)网络的领域分类方法。该文利用隐含主题模型学习隐含主题注意力,并将其引入到文本分类常用的双向长短时记忆网络(BiLSTM)中,与软或硬注意力(soft-or hard-attention)机制一起构成协同注意力。在中文话语领域分类基准语料SMP-ECDT上的实验结果表明,隐含主题协同注意力网络取得了显著优于注意力机制的领域分类效果,比基线注意力机制Soft att、Hard att以及单独的隐含主题注意力机制BTM att分别提高了2.85%、1.86%和1.74%的分类正确率。此外,实验结果还验证了,在额外的未标记数据上训练隐含主题,可以进一步提高该文方法的领域分类性能。

基于小波分析的特征提取文本分类方法研究 下载:43 浏览:261

朱晋1 怀丽波1 崔荣一1 尹慧2 《当代中文学刊》 2018年12期

摘要:
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。

一种基于支持向量机的雷达多目标分类方法 下载:54 浏览:319

张玲1 陈路路1 梁进科1 仉树军2 《无线电研究》 2020年1期

摘要:
针对小样本条件下雷达目标分类精度低的问题,提出了一种基于支持向量机(Support Vector Machine,SVM)的雷达目标分类方法。通过雷达目标特征的提取、选择和分类器的设计,实现了目标的多分类,且提高了目标分类精度。实验结果表明,基于二维特征的分类器可实现多目标的高精度分类,且平均分类精度均优于85%。

自然聚落尺度下村庄分类方法的研究——以天等县为例 下载:61 浏览:363

江雪怡 时雨欣 汪宜漾 马芸 周游 《中国城镇》 2020年7期

摘要:
在国家实施乡村振兴战略的大背景下,村庄发展受到格外关注。本文在综述国内外关于村庄分类研究的基础上,结合我国自然聚落的分布特征,提出以居住密度为单一分类标准的定量化村庄分类方法。以广西壮族自治区崇左市天等县为研究区域,借助GIS软件实现居住密度的获取,并划分出5种细胞类型,实现了在自然聚落尺度下对天等县域的村庄分类,一定程度上弥补了行政村域尺度下进行村庄分类的不足。本文总结的分类方法操作简单,有助于了解村庄的实际分布特征,对以后的具体村庄规划与设计具有十分重要的指导意义。

基于ID3算法的商务网站客户分类研究 下载:49 浏览:403

郑焱 《软件工程研究》 2020年6期

摘要:
ID3算法作为最经典的决策树分类方法,因其直观、简单、容易实现等优点,在电子商务领域得到了广泛应用。文章首先分析了ID3算法的基本原理与流程,然后以某商务网站为例,以其客户交易数据为研究对象,深入探讨了该算法在客户分类中的具体应用。通过该算法的使用,可对商务网站的客户进行准确分类,从而为其开展个性化服务及精准营销提供重要的理论依据。

一种基于变分自编码器的高光谱图像分类方法 下载:84 浏览:490

徐朋磊 薛朝辉 车子杰 《测绘科学与技术》 2020年3期

摘要:
深度学习可以有效表达影像的深层特征,在遥感图像处理特别是在分类方面取得了良好的效果。提出了一种基于变分自编码网络的高光谱遥感影像深度学习分类方法,该方法利用变分自编码器进行无监督训练,用分类层替换解码层,输入训练样本进行分类网络的微调,最后在分类器预测的类别概率图基础上使用条件迭代模型求解马尔可夫随机场,对分类结果进行优化。在两幅通用高光谱数据集上进行分类实验,结果表明基于变分自编码器的高光谱遥感影像分类方法取得了优于其它方法的分类效果。

基于字词特征自注意力学习的社交媒体文本分类方法 下载:43 浏览:373

王晓莉1 叶东毅2 《人工智能研究》 2020年9期

摘要:
社交媒体文本中突出的长尾效应和过量的词典外词汇(OOV)导致严重的特征稀疏问题,影响分类模型的准确率.针对此问题,文中提出基于字词特征自注意力学习的社交媒体文本分类方法.在字级别构建全局特征,用于学习文本中各词的注意力权值分布.改进现有的多头注意力机制,降低参数规模和计算复杂度.为了更好地分析字词特征融合的作用,提出OOV词汇敏感度,用于衡量不同类型的特征受OOV词汇的影响.多组社交媒体文本分类任务的实验表明,文中方法在融合字特征和词特征方面的有效性与分类准确度均有较明显的提升.此外,OOV词汇敏感度指标的量化结果验证文中方法是可行有效的.

双分支迭代的深度增量图像分类方法 下载:54 浏览:375

何丽 韩克平 朱泓西 刘颖 《人工智能研究》 2020年4期

摘要:
针对深度增量学习可能产生灾难性遗忘的问题,提出双分支迭代的深度增量图像分类方法,使用主网络存储旧类知识,分支网络学习增量数据中的新类知识,并在增量过程中使用主网络的权重优化分支网络的参数.使用基于密度峰值聚类的方法从迭代数据集中筛选典型样本并构建保留集,并加入增量迭代训练中,减轻灾难性遗忘.实验表明,文中方法的性能较优.

不同分类方法在土地利用信息提取中的精度对比 下载:58 浏览:424

何立恒1 覃伟2 徐迅3 《测绘科学与技术》 2018年12期

摘要:
以东方市为研究区,对OLI影像分别采取基于像元的五种分类方法实施土地利用分类,自评和对比验证分析影像在不同分类方法、不同土地利用类型上的分类精度。研究结果表明:在相同样本量和没有辅助数据的情况下,监督分类精度高于非监督分类,支持向量机的分类方法能够较好地提取土地利用信息,各地类的用户精度、生产者精度较高,总体精度达88.13%,Kappa系数为0.86。不同地类的分类精度差异明显,建设用地和水域的分类精度较高,未利用地和耕地的分类精度较低,林地、草地、耕地等绿色植被之间存在混淆。该研究成果为合理选择分类方法应用于土地利用信息提取提供科学依据。

LIDAR点云的获取及分类方法浅析 下载:68 浏览:368

吴端松 《地球科学探索》 2019年11期

摘要:
Lidar能够实时快速的获取高精度的三维地面信息;Lidar产品能方便的与多种实用程序软件接口直接连接,如CAD、三维动画软件等等。这些优势使得Lidar得到了越来越广泛的应用。机载激光雷达(Light Detection And Ranging,简称LiDAR)量测技术是应用机载激光雷达系统进行三维空间测量,得到密集的地面物体的三维坐标点云数据,再通过相关软件处理后,获得DEM、等高线图、正射影像图及三维建筑物模型。由于Li DAR系统本身包含激光、全球定位系统(GPS)和惯性导航系统(INS)三种技术,并与数字航摄仪相结合,而且激光脉冲不受阴影和太阳角度影响,其高程数据精度不受航高限制,因此经过专用软件处理,可在空中完成地面高程模型DEM及数字正射影像图DOM的大规模生产,大大提高航测成图的作业生产效率,减少生产环节,缩短生产周期,提高成图精度。由于比常规摄影测量更具优越性,近些年得到了迅速发展。

基于数据点本身及其位置关系辅助信息挖掘的分类方法 下载:79 浏览:491

顾苏杭1 王士同2 《人工智能研究》 2018年6期

摘要:
挖掘除数据点本身以外的信息并以此引导和提高数据分类的精度是值得研究的课题.由此,文中提出建立与数据集对应的网络方法挖掘数据点之间的位置关系及关联信息.依据网络节点连接特性确定节点及子网络效率,赋予节点浓度概念,迭代计算节点的真实影响力,充分挖掘并处理蕴含在数据点关联作用中的信息作为数据点物理特征之外的辅助信息,构建基于数据点本身及其位置关系辅助信息挖掘的分类方法.在保证较高数据分类精度的前提下,文中方法具有较低的时间复杂度.在人造数据集和真实数据集上实验验证文中方法的有效性,该方法尤其与经典的分类方法存在显著区别.
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享