[发明专利]基于社团结构挖掘算法的在线社会网络信息传播最大化方法有效
申请号: | 201510186252.2 | 申请日: | 2015-04-17 |
公开(公告)号: | CN104820945B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 吴骏;海军;彭岳;李宁;吴和生;谢俊元 | 申请(专利权)人: | 南京大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于复杂网络社团发现算法的信息传播最大化方法,包括如下步骤:1)复杂网络生成阶段:预处理从在线社会网络上爬取到的数据变为有向带权图;模型训练阶段:a)利用社团发现算法对复杂网络进行社团发现。b)为每一个社团,输出对应的子图。c)为每一个子图进行不同种子节点选取实验。d)利用所产生数据进行训练模型,并把得到的模型保存到指定区域以待使用。2)种子节点选取阶段:a)要进行挖掘的原始复杂网络分割为不同的社团,并生成对应子图。b)导入模型训练阶段训练好的预测。c)利用预测模型计算出每个子图应分配到几个种子节点进行挖掘。复杂网络数据中选取最具传播能力节点时的时间效率。具有选取结果优,数据处理速度快等优点。 | ||
搜索关键词: | 复杂网络 种子节点 模型训练 社会网络 社团发现 信息传播 最大化 社团 算法 预处理 复杂网络社团 有向带权图 阶段训练 模型保存 时间效率 挖掘算法 训练模型 预测模型 数据处理 挖掘 输出 分割 预测 分配 传播 发现 | ||
【主权项】:
1.一种基于复杂网络社团发现算法的信息传播最大化方法,其特征在于,包括如下步骤:1)复杂网络生成阶段:a) 从在线社交网站爬取用户之间的链接关系与用户的操作日志;b) 建立静态模型static model ,并从日志文件学习出节点之间的影响关系与影响度值;c) 把学习到的节点之间的传播关系与用户链接关系结合并得到一个有向带权图;2)模型训练阶段:a) 利用社团发现算法Walktrap对复杂网络进行社团发现;b)为每一个社团,输出对应的子图;c)为每一个子图进行不同种子节点选取实验,并保存覆盖度实验数据;c)中:设k为种子节点数,k初始值为1, 每个子图节点总数记为g_size;(1)利用现有的贪心算法选择出k个种子节点;(2)利用monto carlo模拟算法计算出所选出k个节点的传播值,进而计算出覆盖度;(3)记录,覆盖度、子图大小、模块度、所选种子节点数;(4)对k进行加1操作,如果k大于g_size, 则结束该图的试验,否则,回到(1);d)利用所产生数据进行训练,并把得到的模型保存到指定区域以待使用;3)种子节点选取阶段:a)要进行挖掘的原始复杂网络分割为不同的社团,并生成对应子图;其中该复杂网络为步骤1)生成的复杂网络;b)导入模型训练阶段训练好的预测模型;训练一次能反复使用;c)利用预测模型计算出每个子图应分配到几个种子节点进行挖掘,挖掘方法如下:设k为当前已经挖掘到的种子节点数目, 初始值为1 ;budget为要挖掘的种子节点总数;设max_delta记录当前得到的最大影响值增量;sel_g指示第k个种子节点最适合分配的子图;Influence用来暂时记录影响值;coverage为覆盖度,即被激活节点在全部节点中的比重;每一个子图数据都有一个属性pre_influence,用来存放某个子图上次增加一个种子节点时得到的影响值;i用于指示子图, 初始值为1;(1)导入训练好的预测模型到svm_predict里;(2 导入所有子图的数据到subgraph[n],n为子图数目;(3)把全部子图数据的pre_influence属性值设为0;(4)如果k大于budget,则到(13),否则到(5);(5)找出第i个子图的子图大小,模块度,已分配到种子节点数信息;(6)计算第i个子图增加一个种子节点时的覆盖度;coverage=svm_predict,子图大小,模块度,已分配到种子节点数+1;(7)计算第i个子图增加一个种子节点时的影响值;influence=coverage*子图大小;(8)计算第i个子图增加一个种子节点时的影响值增量;delta= influence ‑ subgraph[i]. pre_influence;(9)记录目前影响值增量最大的子图序号;if(delta >max_ delta){max_ delta =delta;cur_max=i;}设i代表第i个子图,max_size为全部子图数目,i初始值为1;每次i从1迭代到max_size,即遍历所有子图,从而给合适的子图分配一个种子节点指标;如此分配完所有的种子节点;p_i指示本次迭代中最合适的子图;max_delta本次迭代中能够得到的最大的边际效益值;delta为暂存边际效益计算结果的变量;(10)对i进行加1操作,如果i为超出子图总数则回到(5),否则到(11);(11)为合适的子图增加一个种子节点指标;(12)对k进行加1操作,并回到(4);(13)结束;d)利用种子节点选取算法为每一个子图选取种子节点;种子节点选取时选取当今效率最高的贪心算法;最终集聚所有子图的种子节点形成最终结果;4)结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510186252.2/,转载请声明来源钻瓜专利网。