[发明专利]基于随机游走访问频数的入度信息估计方法及系统有效
申请号: | 201811632238.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109657160B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 吕欣;陈洒然;刘忠;谭跃进;秦烁;蔡梦思;黄格;肖时耀 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 董惠文 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 游走 访问 频数 信息 估计 方法 系统 | ||
本发明公开了一种基于随机游走访问频数的入度信息估计方法,包括步骤1:从待估计入度信息的有向网络中随机选择随机游走的种子节点,所述种子节点为网络的任意节点,然后实施随机游走,随机游走的后续节点由当前节点的邻居节点随机选出;步骤2:在随机游走过程中,记录各个节点i被重复访问的次数xi;步骤3:当实施行走的步数n与网络的节点数N相等时,统计每个节点i被访问的次数xi;步骤4:根据所统计的每个节点i被访问的次数估计入度信息并输出;本发明针对有向网络中的无向性不强的问题时,通过统计随机游走过程中每个节点被访问的次数进行入度信息的估计,其估计出的入度信息的误差较小,且估计的效率更高。
技术领域
本发明属于社会网络拓扑信息估计领域,尤其涉及一种基于随机游走访问频数的入度信息估计方法及系统。
背景技术
当前在线社交网络规模巨大,为研究者们提供了研究复杂网络、真实群体特征、行为的平台。而又由于其规模巨大,研究者们无法进行全网络信息收集或获取用于分析。一般地,只能通过随机游走的方式,获取网络的部分信息。利用获取的网络部分信息去恢复网络的拓扑结构是后续进行复杂网络分析、群体特征分析等的基础。但是怎样通过获取的网络部分信息去恢复网络拓扑结构中重要的一个环节是对网络入度分布的估计,因为在随机游走过程中,入度信息是潜在的、隐藏了。有了入度信息的估计,即网络入度分布的估计,才能进行网络拓扑结构的恢复,从而进一步得出全网络的特征。
传统的入度信息估计方法,利用随机游走过程中能够收集到的出度信息,假设当网络中节点的入度边和出度边高度对称时,即网络无向性程度较高时(无向性即无向边的比例),可以得到基于出度信息的估计方法EST_out:
其中,表示网络的入度分布估计,表示网络的出度分布的估计,qd(kout)是随机游走抽样获取样本的出度分布。
然而对于在线社交网络来说,用户之间的关系或行为是有方向的,例如,“关注行为”可以是“关注”或“被关注”两种关系;“选举行为”可以是“选举”或“被选举”关系等等。由此,网络的边可以分为“入度边”和“出度边”,用于分别描述“指向”该节点的关系(边)和该节点指向其他节点的关系(边)。并且在大多数情况下,有向网络中的无向性不强。由此,利用式(1)得到的入度信息估计会引起很大的偏差,因此需要去解决有向网络中的入度信息估计问题。
发明内容
本发明要解决的技术问题是:由于现有技术中对于网络入度信息的估计方法是在网络无向性程度较高时通过出度信息进行的估计方法,该方法在应用到有向性较高的社交网络中时,所估计出来的入度信息误差较大,从而不能很好地通过入度信息来了解网络中用户行为、恢复网络拓扑结构,提出了一种对于有向网络来说入度信息估计误差较小的基于随机游走访问频数的入度信息估计方法。
为解决该问题,本发明采用的技术方案是:
一种基于随机游走访问频数的入度信息估计方法,包括以下步骤:
步骤1:从待估计入度信息的有向网络中随机选择随机游走的种子节点,所述种子节点为网络的任意节点,然后实施随机游走,随机游走的后续节点由当前节点的邻居节点随机选出;
步骤2:在随机游走过程中,记录各个节点i被重复访问的次数xi;
步骤3:当实施行走的步数n与网络的节点数N相等时,统计每个节点i被访问的次数xi;
步骤4:根据所统计的每个节点i被访问的次数估计入度信息并输出;
其中mi是随机游走过程中被访问了xi次的节点的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811632238.0/2.html,转载请声明来源钻瓜专利网。