PDF下载
基于粗糙集和多通道词向量的中文文本情感特征分析

陈波1 谢珺1 苗夺谦2 王雨竹1 续欣莹3

1.太原理工大学信息与计算机学院;2.同济大学电子与信息工程学院;3.太原理工大学电气与动力工程学院

摘要: 粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法。利用粗糙集决策表对整个语料库进行情感词特征建模,采用Johnson粗糙集属性约简算法对决策表进行化简,保留最小的文本情感词特征属性集,之后再对该集合中的所有情感特征词进行词嵌入表示,最后用逻辑回归分类器验证RS-WvGv方法的有效性。另外,该文还定义了情感词特征属性集覆盖力,用于表示文本情感词特征属性集合对语料库的覆盖能力。最后,在实验对比的过程中,用统计检验进一步验证了该方法的有效性。
关键词: 属性约简;情感特征提取;词向量;情感分类
DOI:
基金资助:
文章地址: