[发明专利]基于MMSB的微博网络用户行为分析方法有效
申请号: | 201310418198.0 | 申请日: | 2013-09-13 |
公开(公告)号: | CN103488885A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 胡光岷;辛佰惠;刘唯一;于富财 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 成都宏顺专利代理事务所(普通合伙) 51227 | 代理人: | 周永宏 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mmsb 网络 用户 行为 分析 方法 | ||
技术领域
本发明属于网络应用技术领域,具体涉及一种基于MMSB的微博网络用户行为分析方法的设计。
背景技术
微博是一种在线社交网络,它为注册用户提供一个网络交流平台,用户通过该平台可以进行一系列的社交活动,比如商务、交友、获取信息、好友之间互动等,微博已经发展成为一种非常重要的信息传播和交流工具,成为现实社交的一种丰富和扩展。微博有大量的注册用户,而且每个用户都有不同的行为,用户行为的不同主要体现在每个用户的兴趣、爱好、关注的内容、发微博的频率、转发微博的频率上,所以分析用户的行为对整个微博网络具有重要的实际意义。首先,分析用户的行为能够帮助我们找出网络中不同用户之间的关系,从而方便网络管理员对用户和社团的管理;其次,用户的行为分析结果对我们准确找出微博中的关键用户有重要的作用;同时,用户行为信息、关键度信息等为微博舆论的监督、引导、控制等提供了重要的依据。
微博中用户的行为是相互关联的,比如某个用户博文的发布或者转发的数量非常大,那么他的博文被关注他的用户转发的数量也会较多;一个用户的博文发布或转发量和关注他的用户发表博文的数量是有联系的。传统的统计学方法通常假设数据是独立的,因此不适用于微博中用户的行为进行分析。鉴于此,业内一些学者提出了相关联的数据分析方法。现有的用户行为分析方法都认为网络可以划分为若干个社团,所谓社团是指网络中具有共同特征的用户组成的小范围团体。这些方法建立的模型都假定每个用户仅属于一个社团,用户之间的连接关系也受到社团与社团之间连接关系的限制,这样分析的结果中只得到了用户在某一个社团内的行为特征。而现实的微博中每个用户并不一定仅仅属于一个社团,很多活跃度高的用户在多个社团中都有一定的参与度,现有的用户行为分析方法忽略了这种用户跨社团的多角色性。针对现有用户行为分析方法的不足Edoardo等人提出了混合隶属度随机块模型(Mixed Membership Stochastic Blockmodels)的用户行为分析方法,该方法中对每个用户提出了混合隶属度的概念,来挖掘用户的多角色性,能更准确的分析出用户的行为特征。虽然MMBS用户行为分析方法考虑到了数据之间的关联性和用户的多角色性,但却不能直接应用于微博网络进行用户行为分析,因为MMSB模型中把用户之间的连接关系分为连接和不连接两种关系,并没有考虑到微博网络中用户之间转发多次微博即节点之间存在多条连接的情况。
对于微博,现有的用户行为分析方法有其一定的局限性:目前的很多用户行为分析方法,都是从单个对象获取数据,并且假设网络中数据是独立的,或者在一定条件下是独立的,而现在的微博用户数据都是相关联的,因此用这些方法分析微博网络得出的结果就不准确;现有的用户行为分析方法假设用户仅属于一个社团,不能挖掘到用户跨社团的多角色信息;MMSB用户行为分析方法考虑到了数据关联性,也能够挖掘用户的多角色信息,但是把网络中用户的连接关系只分为连接和无连接两种情况,没有考虑到微博用户之间的连接权重。因此MMSB用户行为分析方法不适用于微博转发网络。
发明内容
本发明所要解决的技术问题是针对现有用户行为方法不适用于微博网络的缺点,提出了一种基于MMSB的微博网络用户行为分析方法。
本发明解决其技术问题采用的技术方案是:基于MMSB的微博网络用户行为分析方法,具体包括:
S1、设定所建立的模拟微博网络的混合隶属度和转移概率矩阵B,创建MMSB模拟微博网络;
S2、根据所述步骤S1中建立的MMSB微博模拟网络,已知混合隶属度和转移概率矩阵B,由模型可得出整个微博网络中任意两个节点之间的微博转发百分比p(Y)的联合概率公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310418198.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用