[发明专利]基于微博文本情感计算的网络社会影响最大化算法在审
申请号: | 201310475440.8 | 申请日: | 2013-10-12 |
公开(公告)号: | CN103530360A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 覃晓;元昌安;唐涛;元建 | 申请(专利权)人: | 广西师范学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广西南宁公平专利事务所有限责任公司 45104 | 代理人: | 王素娥 |
地址: | 530001 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 情感 计算 网络 社会 影响 最大化 算法 | ||
技术领域
本发明涉及文本情感计算、网络社会计算及影响最大化领域,具体是基于微博文本情感计算的网络社会影响最大化算法。
背景技术
网络影响最大化计算能够找出网络中那些最有影响力的成员,向他们提供信息或商业样品,希望借助于他们的推荐,达到向网络中其他成员传播或营销的目的。随着WEB2.0的出现及流行,很多大型在线社交网站的成员数目也急剧上升,这使得传统的影响最大化算法和传播模型研究都面临着巨大的挑战,社会网络中影响最大化算法再次成为研究热点。
目前该领域的研究方法主要是1)利用用户交互数据扩大网络影响范围。主要是通过计算用户之间交互数据的影响概率,或者对用户的历史行为日志进行统计,来估计用户之间的影响度。然而这种方法并不考虑用户之间交互数据的内容对影响范围的作用。2)对基于信息传播模型的算法进行改进,以达到降低算法的时间复杂度的目的。
综上,目前关于网络影响最大化的研究大多基于网络结构,其主要存在两个问题:
1)没有充分挖掘用户交互数据的内容在网络影响最大化模型中的作用。在微博、评论、说说等新兴系统中,用户提交的内容数据和用户之间互相回复、交流的文本能够更如实地反映用户之间的关系和影响。因此,这些数据对于网络影响最大化的计算具有更强的说服力。
2)在网络影响最大化计算中没有充分考虑包含在用户发布内容中的情感信息。情感信息对于理解网络社会关系具有十分重要的应用价值。例如,在网络舆情监控中,如果能对那些具有最大负面影响的用户进行重点监控,就能够及时遏制谣言、对防治虚假信息和恶性社会事件的扩散提供有力的技术保障。
为此,将情感计算引入网络影响最大化计算中,将能提高影响最大化计算的准确度和计算结果的说服力。
将情感计算引入影响最大化模型领域,目前国内仅见一篇报道——面向微博的情感影响最大化模型。该文针对目前影响最大化的求解算法仅仅依赖社交网络图的不足,基于微博的转发关系树和微博内容的情感倾向性,以及用户的社交网络图,提出了一个能够刻画用户情感影响的情感影响最大化模型——情感影响分配模型(sentiment influence distribution,SID)。附图(1)为SID模型的实现方案图。
(1)SID模型在计算微博情感倾向性的时候,采用基于情感词典的方法。情感词典采用知网的情感分析用词语集(HowNet)。并用方案图中的公式1计算。然而微博中的词语表达方式非常丰富,有一些特有的词语跟字面上的意思是相反的,如加了引号的“高兴”、“幸福”等,或一些词语是网络的新流行词语(如“表哥”),是知网情感分析词语集中没有的,所以在计算情感倾向性时,现有技术的方法过于简单,情感倾向性分析结果还可以进一步提高。
(2)SID模型在计算情感影响最大化时,网络社区的关系结构是用转发关系树来反映的。然而在实际的微博系统中,很多用户在表达观点的时候,并不转发其关注用户的微博,还有的用户习惯以评论或回复其关注用户的微博为表达观点的方式。因此,转发关系树并不能全面的反映社区的关系,从而也就不能很好的表现影响最大化的群体。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于微博文本情感计算的网络社会影响最大化计算方法。
本发明解决上述技术问题的技术方案如下:
基于微博文本情感计算的网络社会影响最大化算法,操作步骤如下:
1.微博特殊词典构造,具体方法如下:
针对微博中有很多变形词,新流行词的特点,运用中文信息处理技术(分词、提取特征等),将得到的变形词、新词进行注解;分析其词性、词义、同位词、上下位词、倾向性及索引结构,并以词典形式存储。
2.微博情感倾向性分析,具体方法如下:
在知网情感分析词语集(HowNet)和微博特殊词词典的基础上,对微博进行情感倾向性分析。首先判断微博中的词语是否出现在HowNet中,若不是,则检索微博特殊词典,然后输出该词语的倾向性,统计所有词语的倾向性,并最终获得微博的情感倾向性计算结果。
微博d的情感倾向性(EScore)的计算方法:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范学院,未经广西师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310475440.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:豆腐的包装装置
- 下一篇:用于分析微生物生长的方法