[发明专利]一种支持时序社交网络图的无监督表示学习方法和装置在审
申请号: | 202111011643.2 | 申请日: | 2021-08-31 |
公开(公告)号: | CN114048849A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 赵浩新;郑力;王陆;谷明菲;高阳 | 申请(专利权)人: | 赵浩新 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06Q50/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 102206 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 时序 社交 网络图 监督 表示 学习方法 装置 | ||
本发明涉及一种支持时序社交网络图的无监督表示学习方法和装置。该方法包括:1)给定时序图,按照时间戳将其划分为不同时间点的图数据快照,基于时间函数处理结构信息和内容信息,使得近期的内容和结构信息较远期的内容和结构信息权重较大。2)每个图数据快照,按照其到当前时间的距离计算快照的权重,输入到统一的图自编码器中,单个图数据快照的损失考虑平均距离平方误差,整体损失考虑快照权重的所有误差之和,根据整体损失函数,学习图自编码器的参数,从而产生时序信息感知的图节点表示。该方法是一种无监督学习方法,能够充分考虑时序因素,在无标记环境中融合内容和结构信息。
技术领域
本发明属于信息技术领域。考虑到很多场景中,如社交网络中的图数据天然带有时序因素,本发明主要在无监督学习过程中,依据图自身的特征,融合不同阶段的时序信息,考虑节点周围邻居的近期影响和远期影响,学习包含时序、结构和内容信息的节点特征编码,为后续的分析任务提供支持。
背景技术
近年来,动态图技术发展迅速。动态图的数据为我们分析用户信息带来可能性的同时,也带来了巨大挑战。以社交网络为例。海量用户每天在网站上执行不同的操作,比如关注、评论、转发、点赞等操作,这为图带来了数百万条新的边。用户每天发布的状态信息,或是修改个人属性,也会为社交网络产生大量的内容信息。这些信息是分析和挖掘社交网络的特性和潜在模式的重要基础。
图表示学习方法的发展为动态图数据的分析提供了良好的基础。图表示学习能够合理地结合不同的特征,从给定的数据中学习隐含的规则。考虑到社交网络中数据体量庞大,采用人工检查来获得标记数据的方式代价昂贵。本发明专利主要着重于无监督学习方法,训练阶段不依赖于标记数据。图自动编码器(GAE,Graph Auto-Encoders)是一种典型的无监督图表示学习方法,它的基本思路是用已知的图经过编码(如图卷积模型)学到节点向量表示的分布,在分布中采样得到节点的向量表示,然后进行解码(如通过链路预测)重新构建图。
以社交网络为例,在社交网络的图表示学习中,我们利用上述方法学习到的节点向量表示,作为网络中用户的特征向量,用以表示他们的属性(内容)、关系(结构)等信息。通过融合了多方面信息的特征向量,我们便可以进行后续的数据分析,例如人员档案构建、人员关系分析、潜在社区挖掘、判定异常人员等。
然而,现有的图数据表示学习技术更加侧重于结构和内容的融合。现有的图表示学习模型,无法直接在特征向量中捕捉时序相关信息。时序信息是社交网络的内在信息,通过考虑社交网络中各个节点属性的修改时间和内容的发布时间,以及不同类型边(关注、评论、转发、点赞等)的先后生灭时间,可以更准确地反映出社交网络中各个节点的动态变化情况,以及不同节点之间的动态交互关系。本发明专利的重点是扩展现有图数据表示学习技术,提升图表示学习对于时序信息的捕捉能力。
发明内容
本发明提出了在社交网络中捕获时序信息的无监督图表示学习方法和装置。
在后续描述过程中,本发明的数据模型记为图G=(V,E),其中,V表示节点集合,E表示边集合。对于节点v∈V,节点v上带有一条内容信息的序列,且序列上的每个内容都带有时间戳。以社交网络为例,这个序列表达了用户在什么时间点来发表了什么内容的帖子。边e∈E表示两个节点之间的关系。e上也带有时间戳信息,来表示两个节点什么时间建立的关联关系。简化起见,所有的时间戳采用逻辑时间戳。
本发明采用的技术方案如下:
一种支持时序社交网络图的的无监督节点表示学习方法,包括以下步骤:
给定时序社交网络图,按照时间戳将其划分为不同时间区间内的图数据快照;
基于时间函数处理图数据快照中的结构信息和内容信息,使得近期的内容信息和结构信息较远期的内容信息和结构信息权重较大(即近期的结构信息和内容信息的权重大于远期的结构信息和内容信息的权重);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵浩新,未经赵浩新许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011643.2/2.html,转载请声明来源钻瓜专利网。