[发明专利]基于word2vec的舆情倾向性分析方法在审
申请号: | 201710259721.8 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107239439A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 蒋昌俊;闫春钢;王鹏伟;何良华;罗裕隽 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 上海光华专利事务所31219 | 代理人: | 尹丽云 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于word2vec的舆情倾向性分析方法,包括向量训练阶段、关键句提取阶段和倾向性判别阶段,通过提取新闻关键句缩小判别的特征空间,保留与原文主题相关性较大的内容,剔除无用信息,提高舆情倾向性分析的准确率;将深度学习模型word2vec引入舆情倾向性分析,用于比较词与词之间的语义相似度,并通过词向量来比较语义相似度,能较好识别出具有相同情感倾向但不在情感词典中的词语,即使情感词典不够完备也能获得一个较好的分析效果,同时,融合语法规则对关键句的情感倾向性进行加权计算,结合上下文信息,弥补单纯使用词义相似度的局限性,从句子整体分析倾向性,实现了对篇章级的新闻文本的情感倾向性以及情感强度的准确判别。 | ||
搜索关键词: | 基于 word2vec 舆情 倾向性 分析 方法 | ||
【主权项】:
一种基于word2vec的舆情倾向性分析方法,其特征在于,包括:词向量训练阶段:采集新闻数据,通过word2vec深度学习模型对所述新闻数据进行训练,获取词向量训练结果,所述词向量训练结果包括每个词语对应的向量表示;关键句提取阶段:对所述待分析新闻数据进行预处理,所述预处理至少包括对待分析的整篇新闻数据进行断句和关键字提取,根据词向量训练结果计算待分析新闻数据中分句和关键词的匹配程度,获取与关键字匹配度最高的分句和该篇新闻数据的标题,并将其作为新闻关键句群;倾向性判别阶段:比较预处理处理后的新闻关键句群中的词语和情感词的相似度,获取待分析新闻数据的情感评分,通过所述情感评分对新闻数据进行倾向性判别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710259721.8/,转载请声明来源钻瓜专利网。