[发明专利]一种微博舆情传播范围预测的方法在审

申请号：	201510369026.8	申请日：	2015-06-29
公开（公告）号：	CN105183743A	公开（公告）日：	2015-12-23
发明（设计）人：	王海峰;曹云鹏	申请（专利权）人：	临沂大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	四川君士达律师事务所 51216	代理人：	芶忠义
地址：	276002 ***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种舆情传播范围预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及社会网络建模与分析领域，具体涉及一种微博舆情传播范围预测的方法。

背景技术

微博已经成为现代社会最重要的新媒体平台之一，与传统媒体相比，具有及时、碎片化、自由开放和大众性等特征。但是任何人都可以利用微博发布不良观点和评论，而且经过众人的转发和评论后会迅速扩散到整个社会网络中。一些欺骗性的言论能够造成社会安全的破坏、严重的会引发社会群体事件。因此政府相关部门必须对微博中的舆情信息进行分析、监控和预测，为进一步的管理和控制做出准备。

现有的互联网舆情信息监控和分析主要是关注两个问题：一是解决对海量信息的人工化处理的难题，提出一些利用计算机的文本分析和机器学习的方法设计而成的自动舆情分析系统，以此减少网络舆情监控过程中的人工劳动；二是尝试解决网络舆情发现精确度的难题，通过改善和优化文本分析、聚类算法等方法，提高文本中舆情语义挖掘的准确性。

经过对现有技术的文献检索发现，中国专利公开号为：CN101661513B，专利名称为：网络热点和舆情的检测方法，该技术方案提供了网络信息处理领域中的一种网络热点和舆情的检测方法，可以应用到微博舆情的检测和分析中。通过搜集一定时间范围内的微博正文信息和评论信息，并对这些信息的文本内容进行分词处理、概念映射处理，消除语义概念的不确定性，最终提取能够反映文本内容的特征。再利用这些内容特征数据进行聚类，形成若干个包含不等数量的信息文档集合，根据各个集合包含信息文档的数目来判定是否为网络中的热点事件，在对热点事件的信息文档集合进行褒贬倾向的分析，从而掌握网民对该事件的舆情观点，以此来检测微博舆情。

现有对微博监控和分析的方法关注自动化分析处理和舆情信息的判定，忽视了舆情在整个在线社会网络传播趋势的分析，无法向网络舆情管控人员提供舆情传播到了何种程度，即无法判定某事件的舆情扩散程度。本发明从社会网络整体角度来检测和分析微博舆情传播，提出一种预测微博舆情传播程度的方法，通过监测哨兵节点的信息来判断舆情扩散情况。

发明内容

本发明的目的在于解决上述问题，提供一种微博舆情传播范围预测的方法，通过微博预测方法利用实际统计数据建立非线性模型，根据舆情事件的性质来监控哨兵节点的状态来确定微博舆情的覆盖情况，并向网络舆情管理者提供精确的舆情传播量化数据。

本发明解决上述问题所采用的技术方案是：

一种微博舆情传播范围预测的方法，按照下列顺序依次进行：

1)构建微博系统的传播网络模型：将每个微博用户视为一个节点，根据微博的粉丝、关注和好友关系建立节点之间的连边，形成一个复杂的在线社会网络模型；舆情传播范围即舆情消息覆盖率；

2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点；

3)利用哨兵监测节点建立微博舆情传播范围的预测模型；

在实际微博网络中对事件舆情进行实证统计分析，并确定预测模型中的关键参数。

优选的，1)中所述的舆情消息覆盖率为已获知消息的节点集合与全部节点集合的比值，

O=|V‾||V|,]]>

式中表示节点数，|V|为全部节点数，注意全部节点指微博网络中有效用户范围内的节点总数；

消息传播过程是时间序列T＝{t1,t2,…,ti,ti+1,…}，监测时刻t_k的信息覆盖率为O_k，即