[发明专利]基于大数据分析技术的微博转发可视化分析方法及系统在审
申请号: | 201510825096.X | 申请日: | 2015-11-24 |
公开(公告)号: | CN105447144A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 游世学;刘俊康 | 申请(专利权)人: | 北京中科汇联科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙) 11417 | 代理人: | 李文军 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 分析 技术 转发 可视化 方法 系统 | ||
本发明公开了一种基于大数据分析技术的微博转发可视化分析方法,包括:S1、获取源微博和所有转发微博,所述转发微博直接或间接转发所述源微博;S2、提取所述源微博和转发微博中的文本信息;S3、根据提取的文本信息得到所述源微博和所有转发微博的转发关系,所述转发关系包括所述转发微博之间的转发关系;S4、根据所述转发关系绘制可视化图形。本发明还公开了一种基于大数据分析技术的微博转发可视化分析系统。采用本发明的方案,将一个个单独存在的微博关联起来,使转发微博文本间的拓扑关系更加清晰,从而有效地提高微博转发关系的可视化,便于分析转发微博的内在关系。
技术领域
本发明涉及微博大数据分析方法,尤其涉及基于大数据分析技术的微博转发可视化分析方法及系统。
背景技术
微博是当前最流行的社交网络应用,不同于传统的互联网应用,其独特的媒体特性赋予了用户更多的话语权,用户及时信息的接受者,也是信息的发布者和传播者,这也是我们常说的自媒体,每当热点事件发生时,众多用户借助微博平台参与讨论,发表个人观点,伴随事件持续发展,个人意见渐渐汇聚成群体观点,这是社会舆情的重要组成部分,所以,对微博某一些事件的群体观点进行分析,是一件非常有意义的事情。
目前抓取新浪微博的数据一般有两种方式:一种方式是模拟登陆强行抓取HTML源码,然后再对HTMl源码进行解析,提取其中的有价值的信息(用户相关信息,包括头像、性别、粉丝数、地域、标签、ID等等,所发微博的相关信息,包括微博正文、图片信心、被转发、被评论等等)。第二种方式是利用新浪微博官方提供的API来直接请求数据,返回的数据格式是JSON,是一种纯数据的格式、里面囊括了所有的用户需要的数据。
以上两种方式相比,第二种方式拿数据的速度快、完整性高、稳定性强,但是申请API稍微复杂、而且不容易通过验证,现在仍然有很多应用使用的是第一种方式来抓取数据。
但无论通过以上哪种方式拿到的数据都是一条一条的单独零散存在的,每一条数据都是独立的一个个体,和其他的数据比没有什么关系,但是这表面看起来毫无关系的一条条数据实际内部有着千丝万缕的联系,微博的转发是将多条消息文本串联成具有独立话题信息的文本序列,沿着转发序列,旧话题结束,新话题开始,这样,话题之间的连接关系反映了热点事件中的某个话题随着时间的一个演变过程,因此,如果需要全面了解一个话题,既需要单纯的消息文本,也需要文本间的拓扑关系。
发明内容
为了解决上述技术问题,本发明提供了一种基于大数据分析技术的微博转发可视化分析方法,包括:
S1、获取源微博和所有转发微博,所述转发微博直接或间接转发所述源微博;
S2、提取所述源微博和转发微博中的文本信息;
S3、根据提取的文本信息得到所述源微博和所有转发微博的转发关系,所述转发关系包括所述转发微博之间的转发关系;
S4、根据所述转发关系绘制可视化图形。
进一步地,步骤S4中所述的根据所述转发关系绘制可视化图形包括:将转发微博和与该条转发微博具有直接转发关系的源微博或转发微博用线段连接。
进一步地,所述步骤S3还包括:根据所述转发关系得到转发层次,统计对应每个转发层次的转发微博数量。
进一步地,步骤S4还包括:根据所述转发层次和对应每个转发层次的转发微博数量绘制可视化图形。
进一步地,步骤S2还包括:提取所述源微博和转发微博的用户属性,所述用户属性包括实名用户、大粉丝和普通粉丝;步骤S3还包括:统计不同用户属性的用户对应的转发微博数量。
相应地,本发明还提供了一种基于大数据分析技术的微博转发可视化分析系统,包括:
获取模块,用于获取源微博和所有转发微博,所述转发微博直接或间接转发所述源微博;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科汇联科技股份有限公司,未经北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510825096.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种类边接触纳米相变存储器单元的制备方法
- 下一篇:一种透气人造革
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置