[发明专利]一种大规模时序图顶点相似度计算方法在审
申请号: | 201910012983.3 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109684520A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 袁野;王国仁;苗壮;王一舒;马玉亮 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度计算 时序 相似度 计算目标 目标顶点 社交网络 树形索引 数据抽象 随机游走 推荐系统 时间差 索引树 融合 期望 | ||
1.一种大规模时序图顶点相似度计算方法,其特征在于,其包括如下步骤:
S1、将社交网络各个顶点的数据抽象为时序图;
S2、通过随机游走方法和路径融合方法建立树形索引,使用Bootstrap抽样方法估计索引树中每层节点时间差的期望,使用Monte Coral方法计算目标顶点与其他顶点的相似度;
S3、根据步骤S2计算出的目标顶点与其他顶点相似度,找出与目标定点最相似的k个顶点。
2.如权利要求1所述的计算方法,其特征在于,在步骤S1中,所述时序图表示为GT=(V,E,T),其中V表示社交网络中的顶点集合,E表示的是网络中时序边的集合,T表示的各个顶点联系时刻的集合。
3.如权利要求1所述的计算方法,其特征在于,在步骤S2中,所述树形索引的建立包括:
S20101、对所述时序图GT=(V,E,T)中任意顶点u∈V,创建一颗以u为叶节点的单节点树,并记level(u)=0;
S20102、对每个叶节点进行反向随机游走,即对叶节点u进行反向随机游走,得到时序路径pu=(u,v),其中v∈Γin(u,G);记level(v)=level(u)+1,且节点u到达节点v的时间记为tv(u);
S20103、判断任意两个叶节点生成的时序路径是否符合路径融合条件,若符合则进行路径融合;
否则继续进行反向随机游走;直到节点的入邻节点集为空,或者节点的入邻节点集合均不符合时序路径条件,此时停止生成索引;
S20104、重复步骤S20101-S20103直到生成索引数量达到预期数量。
4.如权利要求1所述的计算方法,其特征在于,在步骤S2中,使用Bootstrap抽样方法估计索引树中每层节点时间差的期望就是估计索引树中不同level中节点的时间差的期望进行估计;对索引树中level=i层节点时间差的期望记为ti。
5.如权利要求1所述的计算方法,其特征在于,在步骤S2中,所述使用Monte Coral方法计算目标顶点与其他顶点的相似度包括:对于目标时序图GT=(V,E,T),建立了r个索引;对于给定目标顶点u,每个索引的叶节点上找到节点u,之后记录与节点u在同一颗树上的其他叶节点,并记录该节点与目标节点到达最近的公共祖先节点的路径长度。
6.如权利要求5所述的计算方法,其特征在于,所述最近的公共祖先节点的路径长度为顶点u和v在路径长度为i是首次相遇,记为first(pu,pv)=i,根据公式(1)近似计算顶点相似度,其中,pu=(u1,u2,…,ut),pv=(v1,v2,…,vt),1≤i≤k,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910012983.3/1.html,转载请声明来源钻瓜专利网。