人工客服:2025-06-21 00:30:26

世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
请输入您想了解的内容!
截图后在输入框直接粘贴

请您为我的服务评分:

发送提交
PDF下载
基于GMM的文本规则挖掘的粗糙集方法研究

洪壮壮 黄兆华 万仲保 张薇 高梦茜

华东交通大学软件学院

摘要: 领域文本具有结构复杂、相似性高以及动态变化等特点,且存在着连续型与离散型并存的混合数据,这在一定程度上限制了知识发现方法对文本规则的挖掘效率。针对这一问题,该文提出了基于GMM与粗糙集的文本规则挖掘方法。该方法首先根据目标数据的属性类型构造信息表;然后利用高斯混合模型(GMM,Gaussian Mixture Model)聚类算法对连续数据进行聚类划分,依此对数据进行离散化及状态约简,并生成决策表;最后利用粗糙集理论对决策表进行属性约简,通过约简表对决策规则进行提取。实验结果表明:相比于传统的方法,该文方法拥有更高的抽取精度以及较强的属性约简能力,其信息抽取的平均准确率与F1值能够达到95.0%和95.7%。
关键词: 混合数据;规则挖掘;高斯混合模型;粗糙集;属性约简;决策规则
DOI:
基金资助:
文章地址:https://www.ccnpub.com/yuyind-2-93148

版权所有 © 2025 世纪中文出版社  京ICP备2024086036号-2