[发明专利]一种结合拓扑过滤和社区发现的媒体传播方法有效
申请号: | 201610894204.3 | 申请日: | 2016-10-13 |
公开(公告)号: | CN107943806B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 盛益强;陈婉杰;赵震宇;王劲林 | 申请(专利权)人: | 中国科学院声学研究所;上海尚恩华科网络科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q50/00 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 拓扑 过滤 社区 发现 媒体 传播 方法 | ||
本发明涉及一种结合拓扑过滤和社区发现的媒体传播方法,包括:将用户关系抽象为图,并对图中节点进行基于中心性的拓扑过滤;运用社区发现算法,从经过拓扑过滤的节点所构成的图中挖掘出高密度社区;将高密度社区虚拟化为虚拟节点,得到一个新的节点集合;从新的节点集合中选择种子节点,得到种子节点集合;从种子节点集合中的各个种子节点出发进行媒体传播。
技术领域
本发明涉及社会计算与媒体挖掘方法,特别涉及结合拓扑过滤和社区发现的媒体传播方法。
背景技术
随着互联网和大数据的研究应用日益广泛,包括社交网络影响力传播在内的媒体传播已经成为数据挖掘和社交网络分析中的关键问题之一。对于整个传播过程而言,种子节点(也就是初始化后的活跃节点)的选取是传播的基础,因为种子节点的选取结果直接影响传播的最终效果,包括覆盖率及传播时间在内。目前常用的种子节点的选取方法有贪心算法,基于节点度的启发式算法,基于距离的启发式算法,以及随机算法等。
假设初始化后的活跃节点为S,用f(S)表示使用S中的节点作为种子节点进行传播得到最终活跃的节点数目。以覆盖率较高的贪心算法为例,首先初始化一个空的集合S,然后每添加一个节点时需要遍历所有节点,将使得f(S+v)-f(S)的值最大的那个节点加入节点集合S。使用贪心算法选择种子节点时,由于每次添加一个节点时均需要遍历所有节点,因此导致时间复杂度较高,且贪心算法没有考虑图的拓扑结构,这是贪心算法的局限所在。
对于基于节点度的启发式算法,即选择度数最高的k个节点作为初始的活跃节点,该算法相比贪心算法而言时间复杂度降低很多,但由于该算法每次只选择度数较高的节点,忽略了部分节点的信息,而贪心算法每添加一个节点时均遍历所有节点从而选出局部最优解,因此基于节点度的启发式算法算法效果远不及贪心算法。对于更简单的随机算法,即从原节点集合中随机选取若干节点作为种子节点,由于不确定因素较多,随机性大,一般不被选用。
使用贪心算法进行媒体传播,在选取种子节点集合S时,需要对每一个未激活节点进行验证,当用户节点数量增加时,算法的复杂度非常高。因此,有必要减少验证的节点数,提高验证的节点质量,以改善算法的复杂度,进而提高传播效率。
发明内容
本发明的目的在于克服现有媒体传播方法的效率低下问题,特别是解决贪心算法的时间复杂度高,未考虑图的拓扑结构的问题,从而提供一种高效的媒体传播方法。
为了实现上述目的,本发明提供了一种结合拓扑过滤和社区发现的媒体传播方法,包括:
步骤1)、将用户关系抽象为图,并对图中节点进行基于中心性的拓扑过滤;
步骤2)、运用社区发现算法,从步骤1)所得到的经过拓扑过滤的节点所构成的图中挖掘出高密度社区;
步骤3)、将步骤2)所得到的高密度社区虚拟化为虚拟节点,得到一个新的节点集合;
步骤4)、从步骤3)所得到的新的节点集合中选择种子节点,得到种子节点集合;
步骤5)、从种子节点集合中的各个种子节点出发进行媒体传播。
上述技术方案中,在步骤1)中,所述基于中心性的拓扑过滤的过滤条件为节点的任意一种中心性指标,包括度中心性、介数中心性、紧密度中心性和特征向量中心性中的任意一种。
上述技术方案中,以节点的介数中心性作为基于中心性的拓扑过滤的过滤条件,所述步骤1)进一步包括:
步骤1-1)、设置节点介数的阈值,并计算图结构中所有节点的介数;
步骤1-2)、将所有节点按介数值进行排序;
步骤1-3)、将介数小于或等于节点介数的阈值的节点去除;
步骤1-4)、保持剩余节点在原图中的连接关系并更新相关参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;上海尚恩华科网络科技股份有限公司,未经中国科学院声学研究所;上海尚恩华科网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610894204.3/2.html,转载请声明来源钻瓜专利网。