[发明专利]一种基于三角子图划分的社交网络子图嵌入方法及系统有效
申请号: | 202010036022.9 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111460314B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 金海;黄宏;方子玄 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/951 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 角子 划分 社交 网络 嵌入 方法 系统 | ||
本发明公开了一种基于三角划分的社交网络子图嵌入方法及系统,属于社交网络数据挖掘领域,包括:将用于表示社交网络的网络图划分为三角结构子图和桥接节点;以三角结构子图和桥接节点为虚拟节点,根据三角结构子图之间、桥接节点之间以及三角结构子图与桥接节点之间的连接关系建立虚拟节点之间的虚拟边,由虚拟节点和虚拟边构成转换图;采用随机游走策略对每一个虚拟节点进行上下文采用,以抽取出每个虚拟节点的上下文样本;将上下文样本依次输入到已训练好的词嵌入模型中,得到每一个虚拟节点的向量表示,从而将社交网络图中的三角子图嵌入到向量空间中。本发明能够将社交网络图中的三角子图嵌入到向量空间中,提高社交网络相关任务的准确度。
技术领域
本发明属于社交网络数据挖掘领域,更具体地,涉及一种基于三角子图划分的社交网络子图嵌入方法及系统。
背景技术
随着互联网的兴起,社交网络相关的应用(如qq,微信,微博等)变得越来越普及,基于社交网络的数据挖掘任务(如用户分类,朋友推荐等)也变得越来越重要。网络图是表示社交网络的一种十分方便且有效的工具,将社交网络中的用户表示为网络图中的节点,将社交网络中用户之间的关系表示为网络图中的边,在有向的网络图中,则以关系发起者为有向边的起点,以关系接受者为有向边的重点,这样,针对社交网络的相关研究便可抽象简化为对网络图的研究。网络科学领域的研究人员传统上依靠用户定义的启发式方法从复杂网络中提取特征,从而实现对所表示的社交网络的研究。
近年来,研究者开始广泛使用基于深度学习的方法将网络自动编码到低维度的向量空间中。DeepWalk是第一个被提出来使用表示学习(或深度学习)社区的技术的网络嵌入方法。DeepWalk通过将节点视为单词并生成短随机游走作为句子来弥补网络嵌入和单词嵌入之间的差距。然后,可以将诸如Skip-gram之类的神经语言模型应用于这些随机游走以获得网络嵌入。LINE则采用广度优先搜索策略来生成上下文节点:只有距离给定节点最多两跳的节点才被视为其相邻节点。此外,与DeepWalk中使用的分层softmax相比,它使用负采样来优化Skip-gram模型。Node2vec是DeepWalk的扩展,它引入了一个偏向的随机步行程序,结合了BFS风格和DFS风格的邻域探索。
这些网络表示学习的方法相较传统方法更为轻松,而且在基于网络的相关任务中都展示了不错的结果。然而,目前该领域的这些方法主要集中在节点级嵌入,忽略了网络中子结构的信息,但是,节点级嵌入只是微观结构的嵌入,仅仅研究网络图中的节点级嵌入,会忽略社交网络中用户的群体属性(例如家庭属性),进而会影响节点分类、链路预测等下游应用的准确性。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于三角子图划分的社交网络子图嵌入方法及系统,其目的在于,将社交网络图中的三角子图嵌入到向量空间中,提高社交网络相关任务的准确度。
为实现上述目的,按照本发明的第一方面,提供了一种基于三角子图划分的社交网络子图子图嵌入方法,包括:
(1)将用于表示社交网络的网络图划分为三角结构子图和桥接节点;
(2)以划分得到的三角结构子图和桥接节点为虚拟节点,根据三角结构子图之间、桥接节点之间以及三角结构子图与桥接节点之间的连接关系建立虚拟节点之间的虚拟边,由虚拟节点和虚拟边构成转换图;
(3)采用随机游走策略对转换图中的每一个虚拟节点进行上下文采用,以抽取出每个虚拟节点的上下文样本;
(4)将所抽取的上下文样本依次输入到已训练好的词嵌入模型中,得到转换图中每一个虚拟节点的向量表示,从而将社交网络图中的三角子图嵌入到向量空间中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010036022.9/2.html,转载请声明来源钻瓜专利网。