[发明专利]用于微博的舆情监控方法和装置在审
申请号: | 201210566545.X | 申请日: | 2012-12-24 |
公开(公告)号: | CN103885993A | 公开(公告)日: | 2014-06-25 |
发明(设计)人: | 宋毅强;梁肖;于晓明;杨建武 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L12/58 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 舆情 监控 方法 装置 | ||
技术领域
本发明涉及舆情监控领域,具体而言,涉及用于微博的舆情监控方法和装置。
背景技术
在门户网站上,每天的微博数据量达到几百万到几千万条,各种微博数据纷繁芜杂,而一个网络舆情事件从源头到大爆发只经历比较短的一段时间,虽具有一定的时效性,但是其影响力是非常大的,微博在某种程度上正在影响着社会政治经济的变革,鉴此,对微博的监控成为网络舆情检测和研究相当重要的一部分,但是如何从现有的大量微博数据中,提取出有价值的数据,指导研究人员对舆情事件的研究,成为迫在眉睫的事情。
现有软件对网页数据或者开放平台返回的数据抓取后统一入库后分析。分析者对数据库中的大量数据进行关联,从中取得人物关系和微博转发关系,数据库庞大,无用的数据占的比例太高,有用的信息比例小,增加了分析的难度。
发明内容
本发明旨在提供用于微博的舆情监控方法和装置,以解决上述的问题。
在本发明的实施例中,提供了一种用于微博的舆情监控方法,包括:确定被监控微博的源博主;从源博主出发深度优先遍历被监控微博的转发博主;获取转发博主的粉丝数及其关于被监控微博的转发次数;根据其粉丝数和转发次数设置转发博主的重要度。
在本发明的实施例中,提供了一种用于微博的舆情监控装置,包括:确定模块,用于确定被监控微博的源博主;遍历模块,用于从源博主出发深度优先遍历被监控微博的转发博主;获取模块,用于获取转发博主的粉丝数及其关于被监控微博的转发次数;设置模块,用于根据其粉丝数和转发次数设置转发博主的重要度。
本发明上述实施例的用于微博的舆情监控方法和装置因为确定了微博转发过程中的重点博主,所以减少了监控量,显著地减少了监控数据,降低了舆情分析的难度,提高了舆情分析准确率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了示出了根据本发明实施例的用于微博的舆情监控方法的流程图;
图2示出了根据本发明实施例的用于微博的舆情监控装置的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了示出了根据本发明实施例的用于微博的舆情监控方法的流程图,包括:
步骤S10,确定被监控微博的源博主;
步骤S20,从源博主出发深度优先遍历被监控微博的转发博主;
步骤S30,获取转发博主的粉丝数及其关于被监控微博的转发次数;
步骤S40,根据其粉丝数和转发次数设置转发博主的重要度。
发明人对微博这种自媒体经过分析后发现,一个网络舆情事件从源头然后到大量传播然要经过若干个人的转播和评论。如果在传播途径中,信息经过某一个人时,发生了扩散,那么定义这个博主对于信息传播有贡献,在某一网络事件传播途径中必定有一部分博主对这条信息产生了非常重要的作用,如果只对这部分发挥重要作用的博主进行分析,即可对整个网络舆情事件进行分析。
现有技术对网页数据或者开放平台返回的数据抓取后统一入库后分析,而本方法却从这些数据中确定转发博主的重要度,从而可以只对重要的博主的微博数据进行分析,所以减少了监控量,显著地减少了监控数据,降低了舆情分析的难度,提高了舆情分析准确率。
优选地,通过被监控微博的转发路径上溯到源博主。通过转发路径尽可能地向上追溯到顶层的源博主,如果源头中断,只追溯到一个或多个顶层的博主,则可以将这一个或多个顶层的博主分别作为源博主来进行后续的遍历分析。
优选地,从源博主出发深度优先遍历被监控微博的转发博主包括:从当前的转发博主的微博空间中找到被监控微博;获取被监控微博的转发列表;遍历转发列表上的所有转发博主。从纵向上看,整个遍历是深度遍历,而对当前层次,遍历转发列表上的所有转发博主,这相当于广度遍历。整个遍历过程是标准的算法语言,这里不再赘述。
转发列表是微博传播轨迹的核心组成部分,整个传播轨迹的构成也就是通过转发列表实现的,假设有一条微博原始微博A,当微博B,C,D转发了A时,微博A的转发列表是B-C-D;如若E,F转发了B,那么B的转发列表是E-F,那么从A开始就形成了若干条传播轨迹,其中两条就是A-B-E和A-B-F。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210566545.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车空调管路消音器
- 下一篇:贯流风道系统及具有其的空调器