[发明专利]一种基于文本倾向性分析的网络意见领袖的识别方法在审
申请号: | 201610240853.1 | 申请日: | 2016-04-18 |
公开(公告)号: | CN107305545A | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 陈芬;彭玥;许青青;汤丽萍 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 南京理工大学专利中心32203 | 代理人: | 马鲁晋 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于文本倾向性分析识别网络舆情中的意见领袖的方法。该方法具体包括一是利用指标分析法构建网络意见领袖识别的指标体系,识别出潜在意见领袖。二是加入文本倾向性分析,引入Word2Vec算法,剔除负面情感比例过重的“伪意见领袖”。三是效果的对比验证,将识别出的意见领袖与WeiboRank意见领袖算法进行对比,从而验证本发明提出的算法的有效性和可信度。本发明能够识别出三类典型的意见领袖,涵盖了舆情发展过程中从突发事件起源、影响力不断扩大到舆论态度转变又稳定的各个阶段,为实现监测网络舆情演变过程、捕捉和预测民生民意提供了理论依据,并可作为预防群体突发事件发生的重要措施。 | ||
搜索关键词: | 一种 基于 文本 倾向性 分析 网络 意见 领袖 识别 方法 | ||
【主权项】:
一种基于文本倾向性分析识别网络舆情中的意见领袖的方法,其特征在于,步骤如下:步骤1、指标体系建立,即首先通过分析意见领袖的不同特征建立指标;然后利用层次分析法计算各个指标对应的权重;再通过网络抓取的实际数据与指标进行配对,最后代入公式中得到领袖值,通过分数的排名来识别潜在的意见领袖;步骤2、评价对象的提取,即借助Stanford句法分析方法,对评论的语法结构进行剖析,从而区分微博下评论是针对博主的评论还是针对内容的,实现评价对象的提取;步骤3、文本倾向性分析,即首先是文本预处理,将不同的语料预先进行断句、格式处理、分词和词性标注;然后提取依存关系,即在分句的基础上进行句法分析,找出句子中的依存关系及主导词和修饰词;再确定词典,利用Word2vec模型来实现网络情感新词发现,完善正负情感词典,最终得到正负词典、程度级别词典、否定词词典和标点符号词典;最后进行情感分数的计算,将主导词在正、负面词典中比对得到初始词语极性,再将修饰词与词语程度级别词典和否定词词典比对得到修饰词权重,把二者相乘得出依存关系层次的情感分数;然后提取句子中的标点符号和句子顺序所带有的权值,将其与句子中所有依存关系情感分数之和相乘,就可以得出该条语句的情感倾向分数;步骤4、识别意见领袖,即把微博平台上抓取的数据作为实验语料,进行上述三个步骤的操作,识别出真正的网络意见领袖,并与WeiboRank意见领袖算法进行对比验证。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610240853.1/,转载请声明来源钻瓜专利网。
- 上一篇:语言翻译的装置
- 下一篇:一种出行场景中建筑物的语义刻画方法以及装置