[发明专利]一种基于张量计算的社交网络图摘要的生成方法有效
申请号: | 201911373671.1 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111159483B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 谢夏;王健;金海 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06Q50/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 计算 社交 网络图 摘要 生成 方法 | ||
本发明公开了一种基于张量计算的社交网络图摘要的生成方法,属于社交网络领域。包括:将目标时间段内的社交网络图进行张量化表示,得到布尔张量Tsubgt;G/subgt;;对布尔张量Tsubgt;G/subgt;进行张量分解,得到分解后的节点矩阵Nsubgt;1/subgt;,Nsubgt;2/subgt;、属性矩阵Asubgt;1/subgt;,…Asubgt;h‑3/subgt;和时间矩阵T;对节点矩阵Nsubgt;1/subgt;或Nsubgt;2/subgt;进行聚类,得到聚类簇中心和每个节点所属类型;将簇中心视作图摘要的超点,计算超点之间的超边权值,得到图摘要。本发明对社交网络的节点、节点属性和时间戳进行多维数据融合,基于社交网络图的二值性和张量的高维度表达特性,实现了对高维图数据的统一表达,复杂社交网络的布尔张量化表示。引入张量式CP分解,充分利用旧图张量的分解结果等先验信息,减小了分解张量的大小,提高了图摘要的分解效率。
技术领域
本发明属于社交网络领域,更具体地,涉及一种基于张量计算的社交网络图摘要的生成方法。
背景技术
社交网络分析是近年来数据挖掘界的一个热门话题,查询和推理一个社交网络中的实体之间的相互联系,可以启发对各种现象的有趣和深入的洞察。然而由于社交网络的动态多变结构复杂数据庞大等特点,社交网络图数据的表达和挖掘受到了计算资源和成本开销的一定限制。因此,分析这些复杂的大图数据的起点通常是一个简明的表示,即图摘要。它有助于理解这些数据集以及以有意义的方式表示查询。图摘要对于图数据的处理有非常重要的作用,从减少编码原始图所需的位数到更复杂的数据库操作等等。
近年来,张量方法已经被应用到图摘要方法中,能够产生更精确的带权图摘要。张量是一个多维的数据存储形式,数据的维度被称为张量的阶。由于真实的张量数据往往具有高维稀疏的特性,所以我们通常要使用张量分解的方法来保留原始信息、降低计算复杂度、减少数据损失。
目前的图摘要方法仅仅只关注图数据的时序动态性或者节点属性,而社交网络中的用户节点包含多种属性,用户之间的连接关系每时每刻都会发生新的变化,社交网络图数据同时具有动态性和节点属性。此外,对于时序动态图,当前的方法会对历史数据进行重复计算导致计算效率偏低。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于张量计算的社交网络图摘要的生成方法,其目的在于采用张量式的计算框架,对社交网络图数据的动态性和节点属性进行统一表示,并引入布尔张量分解的方法,来实现可扩展高效的图摘要计算。
为实现上述目的,按照本发明的第一方面,提供了一种基于张量计算的社交网络图摘要的生成方法,该方法包括以下步骤:
S1.将目标时间段内的社交网络图进行张量化表示,得到目标布尔张量TG;
S2.对目标布尔张量TG进行张量分解,得到分解后的节点矩阵N1,N2;
S3.对节点矩阵N1或N2进行聚类,得到聚类簇中心和每个节点所属类型;
S4.将簇中心视作图摘要的超点,计算超点之间的超边权值,得到该社交网络图的图摘要。
优选地,所述社交网络图是动态无向无权图,与时间戳一一对应。
优选地,步骤S2包括以下步骤:
S21.将旧布尔张量Told与目标布尔张量TG合并为布尔张量Tall,布尔张量Tall最后一阶为时间维,所述旧布尔张量Told为前一时间段内的社交网络图的张量化表示;
S22.对布尔张量Tall进行有偏采样,生成k个子张量sTi;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911373671.1/2.html,转载请声明来源钻瓜专利网。