[发明专利]一种基于随机游走的种子节点确定方法及系统在审
申请号: | 201911420931.6 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111191798A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 张灿;宿栋栋;刘伟 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N20/10 | 分类号: | G06N20/10 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 王申雨 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 游走 种子 节点 确定 方法 系统 | ||
本申请公开了一种基于随机游走的种子节点确定方法及系统,该方法包括:首先根据网络中的原始数据获取网络结构和节点近邻信息,其次根据这些信息确定种子节点的需求数量和随机游走参数,然后从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k个种子节点,最后利用k个种子节点组成种子节点集合。该系统包括:网络结构和节点近邻信息确定模块、参数确定模块、随机游走模块和种子节点结合获取模块。通过本申请,能够降低两个节点的网络范围重合的概率,有效提高对影响力最大节点判断的准确性。
技术领域
本申请涉及互联网和人工智能算法技术领域,特别是涉及一种基于随机游走的种子节点确定方法及系统。
背景技术
在互联网和人工智能算法领域,通常需要研究信息传播过程中的影响力传播,影响力传播主要包括三个方面:影响力传播模型、影响力传播学习和影响力传播优化。为提供这三个方面研究结果的准确性,通常需要确定种子节点,也就是确定影响力最大的节点或者影响力最大的节点的集合。
目前,种子节点的确定方法通常是:利用随机游走的方法。游走者从某一个节点开始,按照概率游走至下一个节点,并不断重复该过程。具体地,首先确定随机游走的起始节点,然后从该起始节点开启游走过程,并在整个游走过程中实时记录拥有邻居节点较多的节点,直到游走达到预设的步数为止。
然而目前种子节点的确定方法中,由于游走过程中起始节点是确定的,后续的游走过程都是以该起始节点开启,这种游走方式下,可能出现两个节点的网络范围相似的情况,从而导致在选择关键传播点时出现传播范围重叠的问题,进而导致对影响力最大节点的判断不够准确。
发明内容
本申请提供了一种基于随机游走的种子节点确定方法及系统,以解决现有技术中种子节点的确定方法中容易出现传播范围重叠,导致对影响力最大节点判断不够准确的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种基于随机游走的种子节点确定方法,所述方法应用于信息传播的网络中,所述方法包括:
根据网络中的原始数据,获取网络结构及节点近邻信息;
根据所述网络结构和节点近邻信息,确定种子节点的需求数量k和随机游走参数,所述随机游走参数包括:随机游走的步数t和在每个节点处随机游走的次数m,其中,m、t以及k均为自然数,k≥2;
从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点;
利用k个种子节点组成种子节点集合。
可选地,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:
同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;
记录任一节点随机游走的路径;
针对每个节点,统计包含所述节点的所有路径的数量;
确定包含路径数量最多的节点,定义为当前网络的第一种子节点;
同时从当前网络中的每个节点出发,第二次进行m次t步随机游走;
移除所有包含所述第一种子节点的路径;
在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;
重新同时从当前网络中的每个节点出发,第三次进行m次t步随机游走,直到确定第k种子节点。
可选地,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911420931.6/2.html,转载请声明来源钻瓜专利网。