请选择 目标期刊

基于文本挖掘的电商评论情感分析 下载:68 浏览:392

张敏 《国际科技论坛》 2020年4期

摘要:
本文以京东商城某品牌热水器的购买用户文本评价数据为基础,通过构建LDA主题模型进行主题的提取,实现对其倾向性判断以及所隐藏信息的挖掘与分析,为生产商提供指导性建议。

基于包含度和频繁模式的文本特征选择方法 下载:38 浏览:347

池云仙1,2 赵书良2 李仁杰1 《中文研究》 2018年2期

摘要:
大数据时代,文本数据量的爆炸式增长使得特征选择成为文本挖掘领域最关键的任务之一。文档中的词语和模式规模庞杂,故需保证所挖掘特征的质量充满挑战。"基于模式"特征选择方法具有传统"基于词语"方法所没有的优越特性,可以进行有效地信息去噪,提升文本挖掘性能。该文提出基于包含度和频繁模式的文本特征选择方法:首先,定义基于包含度的相似性度量原理;然后,提出基于包含度的冗余文本频繁模式过滤方法。基于包含度度量文本频繁模式间相似性,以此去除子模式及相似度较高的交叉模式。再通过冗余模式去噪,提升文本频繁模式挖掘性能;提出基于关联度的文本特征选择方法。以经过过滤处理后的非冗余文本频繁模式为基础,进行文本特征选择,并利用词语与文档的关联度进行词语类别划分及权重分配。使所选特征与文档关联度更加清晰,分类效果更好。通过在数据集Reuters-21578上的实验得知,基于包含度和频繁模式的文本特征选择算法性能,优于当前普遍应用的传统文本特征选择方法和新的特征选择及特征抽取方法。

基于主题模型的古典乐器诗词文本挖掘 下载:48 浏览:448

申资卓 杨莹 邵艳秋 《当代中文学刊》 2019年8期

摘要:
古代先贤将乐器按其制作材料分为八类,《周礼·春官·大师》中记载"皆播之以八音:金石土革丝木匏竹。"该文将《全唐诗》、《全宋词》中有关"八音"的诗句、词句作为研究对象,使用基于LDA和NMF的主题挖掘、基于Author-Topic-Model的作者相似度计算等方法。从宏观到微观,从整体诗词到具体诗人/词人,从主题的聚类、动词形容词的抽取到具体诗人词人作品相似度的计算,多维度、多层次、多角度研究了唐诗宋词中的中国古典乐器。

基于Bi-GRU并包含注意力机制的文本数据真值发现 下载:40 浏览:340

常宸1 曹建军2 吕国俊1 郑奇斌1 翁年凤2 《当代中文学刊》 2020年4期

摘要:
针对传统真值发现算法无法直接应用于文本数据的问题,该文提出基于Bi-GRU并包含注意力机制的文本数据真值发现方法。根据文本答案的多因素性,词语使用的多样性与文本数据的稀疏性等特点,该文对用户答案进行细粒度划分,并利用Bi-GRU表征文本答案的语义信息,利用双层注意力机制分别学习用户答案关键词可靠度及用户答案可靠度。依据真值发现的一般假设,无监督学习上下文向量,并最终获得可靠答案。实验结果表明,该算法适用于文本数据真值发现场景,较基于检索的方法及传统真值发现算法效果更优。

粉丝营销与消费者转化:基于微信公众号文本挖掘 下载:47 浏览:449

陈奕 贾思雪 《管理与科学》 2018年11期

摘要:
粉丝营销已成为重要的营销手段之一,但围绕粉丝营销的研究却尚不成熟,更鲜有经典的案例研究。为弥补上述空缺,以中国本土轻奢品牌江南布衣(JNBY)为研究对象,针对其微信公众号在2017年1月到12月期间发布的106篇文章,利用文本挖掘技术,研究了JNBY的分销渠道、产品特性和文化内核。结果表明,微信给企业提供了将文化内核与销售渠道连接起来的平台,一方面有助于将普通用户快速培养成粉丝,从而促进销售;另一方面,文章中传递出的品牌文化进一步增强了粉丝的凝聚力。

网络社交媒体中投资者情绪对股票市场的影响研究 下载:44 浏览:422

许天阳 《管理与科学》 2018年10期

摘要:
行为金融学理论表明投资者情绪会在一定程度上影响投资者决策并进一步影响股价走势。基于互联网社交媒体及网络投票信息,通过爬取新浪股吧及新浪财经多空调查数据,利用文本分析及机器学习算法,构建了一个较为严谨准确的互联网投资者情绪指标,并与同期上证指数进行实证分析及Granger因果检验。研究表明:互联网投资者情绪是证券市场收益率的Granger原因,即投资者情绪有助于预测下一期股市涨跌,但仅在短期内有效;其次,互联网投资者情绪也是证券市场成交量的Granger原因,且对成交量的影响时间通常超过10期,长于对收益率的影响时间;此外,引入投资者情绪后的FF四因子模型对投资组合收益率的拟合效果要优于传统三因子模型。

基于最小风险贝叶斯决策理论的在线评价排名方法研究 下载:33 浏览:428

田博 陈舜杰 周雯 《管理与科学》 2018年5期

摘要:
随着电商模式不断发展和完善,在电商平台上出售的商品种类持续增加。消费者在做出购买决策之前,通常会参考其他消费者发表的在线评论。目前,电商客户评论中的好评与差评的权重风险是相等的,当顾客进行产品购买时会存在评论误判风险。针对好评与差评的权重风险相等的不足,本文提出了一种基于最小风险贝叶斯决策的评价排名方法。提出的方法首先利用网络爬虫语言抓取所有商品累计评论,形成TXT文档;然后根据已有的停用词词典,对生成的TXT文档进行文本预处理,并进行关键词的提取,通过关键词的分类将每一条评论生成一个文档,获得关键词权重;最后利用最小风险贝叶斯决策模型获得风险权重排名,并以天猫为例,与已有排名数据进行比较。提出方法新获得的排名为最小风险权重下的商家排名,有助于顾客在进行高风险商品购买决策时根据不同风险偏好,获得最优购买决策。

新冠肺炎疫情下政策对A股市场的影响研究 ——基于文本数据挖掘方法 下载:309 浏览:2915

孙文雅 曾敏 《数据与科学》 2021年7期

摘要:
2020年伊始,一场突如其来的新冠肺炎疫情席卷全国,打破了所有常规,给人民带来了严重的生命健康威胁,同时对经济也造成了重大冲击。A股在春节过后延迟开市,沪指跌破2700点后又强势反弹,疫情期间股市行情动荡,在此种环境下我国施行宽松的货币政策、减费降税、创业板注册制改革等政策。我国股市是典型的政策市,这些政策的方向对股市的走势必然有很大的影响。本文以新浪财经、东方财富网等网页信息作为数据来源,利用文本挖掘技术爬取新闻资讯,对获取到的数据进行词频分析文本情感分析,发现政策对A股市场是利好的有积极作用。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享