[发明专利]基于word2vec的舆情倾向性分析方法在审

申请号：	201710259721.8	申请日：	2017-04-19
公开（公告）号：	CN107239439A	公开（公告）日：	2017-10-10
发明（设计）人：	蒋昌俊;闫春钢;王鹏伟;何良华;罗裕隽	申请（专利权）人：	同济大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/30
代理公司：	上海光华专利事务所31219	代理人：	尹丽云
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于word2vec的舆情倾向性分析方法，包括向量训练阶段、关键句提取阶段和倾向性判别阶段，通过提取新闻关键句缩小判别的特征空间，保留与原文主题相关性较大的内容，剔除无用信息，提高舆情倾向性分析的准确率；将深度学习模型word2vec引入舆情倾向性分析，用于比较词与词之间的语义相似度，并通过词向量来比较语义相似度，能较好识别出具有相同情感倾向但不在情感词典中的词语，即使情感词典不够完备也能获得一个较好的分析效果，同时，融合语法规则对关键句的情感倾向性进行加权计算，结合上下文信息，弥补单纯使用词义相似度的局限性，从句子整体分析倾向性，实现了对篇章级的新闻文本的情感倾向性以及情感强度的准确判别。
搜索关键词：	基于 word2vec 舆情倾向性分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于word2vec的舆情倾向性分析方法，其特征在于，包括：词向量训练阶段：采集新闻数据，通过word2vec深度学习模型对所述新闻数据进行训练，获取词向量训练结果，所述词向量训练结果包括每个词语对应的向量表示；关键句提取阶段：对所述待分析新闻数据进行预处理，所述预处理至少包括对待分析的整篇新闻数据进行断句和关键字提取，根据词向量训练结果计算待分析新闻数据中分句和关键词的匹配程度，获取与关键字匹配度最高的分句和该篇新闻数据的标题，并将其作为新闻关键句群；倾向性判别阶段：比较预处理处理后的新闻关键句群中的词语和情感词的相似度，获取待分析新闻数据的情感评分，通过所述情感评分对新闻数据进行倾向性判别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同济大学，未经同济大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710259721.8/，转载请声明来源钻瓜专利网。

上一篇：一种文档编辑方法、装置、可读存储介质及终端设备
下一篇：一种垃圾文本识别方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于word2vec的舆情倾向性分析方法在审

专利文献下载