[发明专利]一种基于时空关系的LBSN超网络链接预测方法有效
申请号: | 201711182961.9 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107784124B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 胡敏;陈元会;黄宏程 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537;G06F16/955;G06Q50/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 关系 lbsn 网络 链接 预测 方法 | ||
1.一种基于时空关系的LBSN超网络链接预测方法,其特征在于:该方法包括以下步骤:
S1:获取数据源;从现有的大型社交网络平台获取准确可信度高的数据信息;获取的数据内容包括用户之间的好友关系、用户对位置的评论、评分以及评论时间、位置的经纬度和位置的类别;
S2:构建超网络模型;包括构建时空子网、社交子网、位置子网和类别子网,其中时空子网是利用用户对位置的签到时间构建而成,用于挖掘用户间的时空相似性;
S3:定义和量化超网络边权值;通过用户影响力、隐关联关系、用户偏好、节点度信息这四种不同的方式去定义超网络模型中的边权值;
S4:经过S1~S3的过程,构建好一个加权超网络模型,基于该模型,首先构建多种类型的加权超边结构,通过不同的结构挖掘用户间不同的语义关系,最后通过梯度下降方法训练模型参数,进而预测网络中的链接关系,构建的加权超网络模型分为时空层、用户层、位置层和类别层。
2.根据权利要求1所述的一种基于时空关系的LBSN超网络链接预测方法,其特征在于:所述步骤S2具体为:
通过原始数据信息,提取用户的好友关系列表,用户的签到关系列表以及位置的类别信息;
S21:通过用户签到的时间提取时空节点;时空节点指如果有两个或两个以上的用户在某个特定的时间段共同访问某个位置,那么该位置就被定义为一个时空节点;时空节点反映用户在特定时间特定位置的兴趣偏好;
S22:构造时空-用户-位置-类别四层超网络模型;分为时空子网、社交子网、位置子网和类别子网;四层子网之间的关联关系为用户会因自身的兴趣偏好访问某些类型下的某些兴趣点,并对这些兴趣点进行签到、评论以及评分,如果用户在特定时间内有特殊的兴趣偏好,则这些用户会被同一个时空节点联系起来;至此,基于位置的社交网络下的四层子网构建完成。
3.根据权利要求1所述的一种基于时空关系的LBSN超网络链接预测方法,其特征在于:所述步骤S3具体为:
S31:通过用户影响力量化用户-用户间权值;在基于位置的社交网络中,每个用户的影响力是不同的;将用户影响力分为用户个体影响力以及用户间影响力,并分别通过追随网络以及追随行为来度量;
定义追随行为:如果用户v在其好友u签到过的地方进行一次签到,则认为用户v产生了对用户u的追随行为,相应的会产生一条v到u的有向边;
定义追随网络Gf=(Vf,Ef):其中Gf表示通过追随行为构成的有向网络,Vf表示追随网络中的用户,Ef表示追随行为产生的有向边;
S311:用户个体影响力Iu:用于度量用户因自身行为对网络中其他用户产生的影响;通过划分时间切片的方式考虑不同时间段中用户的影响力,将每个时间切片中用户的追随行为构成相应的追随网络,划分S个时间切片,ts为第s个时间切片,用户最终的个体影响力由每一个时间片中的个体影响力贡献而来,并且离当前时刻越久远的时间片其个体影响力衰减越多;
考虑到网络中孤立节点的存在,采用LeaderRank算法求解用户个体影响力,迭代公式为:
其中Nu表示用户u的邻居节点,表示用户v的出度;在稳定状态下,LeaderRank将GroundNode的分数均匀分布到所有其他节点,节点的最终得分表示为:
Iu=Iu(td)+Ig(td)/N
其中Ig(td)是GroundNode在稳定状态下的分数,N为总的用户数;
由于随着时间的推移,用户的影响力会随之递减,定义衰减函数为:
Wu(ti)=exp(-ln2×(tc-ti)/tm)
其中tc表示当前时刻,ti表示第i个时间片,tm表示影响力减小的半衰期;
用户u在当前时刻个体影响力总值Iu为:
其中Iu(ti)表示第ti个时间片用户u的个体影响力;
S312:用户间影响力:用户间影响力Ii(u,v)用于度量用户u对用户v的影响力大小,将追随行为视为用户间的交互并度量用户间影响力;
提出追随地点比例Ip和追随签到比例Ic这两种衡量指标:
其中,M(v,u)表示用户v追随用户u的签到地点数,Positionu表示用户u的签到位置总数,K(v,u)表示用户v追随用户u的总签到次数,Checkinu表示用户u的签到总次数;
用户影响力I(u,v)为:
基于用户影响力,量化用户-用户边权值,对于节点对u,v,如果u对v的用户影响力高,则其对应边权值也应当高,用户与用户间的边权值量化为:
其中w:(u,w)∈S表示用户u在社交子网中的邻居节点,I(u,v)表示用户与其社交子网邻居节点间的影响力大小;
S32:通过隐关联关系定义和量化位置-位置边权值和类别-类别边权值;
定义位置与位置之间的边权值以及类别与类别之间的边权值:
其中geodist(p,p')表示位置p和p'间的距离,Max|Wp|为两个位置被关联次数的最大值,w(p,p')为位置p和p'被用户关联的次数,为关联次数阈值;
其中|P(c,c')|表示同时属于c和类别c'的地点个数,Max|Pc|表示同时属于类型c和其他某种类型的地点数的最大值;
S33:通过用户偏好定义和量化用户-位置边权值;在基于位置的社交网络中,用户对位置的评分属性能够直观的反映出用户对这个位置的偏好程度;给用户偏好高的位置更高的权值,通过指数函数修正用户-位置边权值:
其中r(u,p)为用户u在位置p处的评分;
S34:通过节点出度定义和量化剩余的边权值。
4.根据权利要求1所述的一种基于时空关系的LBSN超网络链接预测方法,其特征在于:所述步骤S4具体为:
S41:定义超边和超边权重;
定义三种类型的超边:
一类超边SEI:指只包含一种类型节点的超边,在超网中属于一类特殊的超边;
二类超边SEII:指相邻两层子网之间的节点对构成的边,其特点是只包含两种异质节点;
三类超边SEIII:指相邻三层子网构成的边,其特点是只包含三种异质节点;
超边权重指每条超边所具有的权值,通过超边中包含的边权值计算得到;
S42:超链接预测:基于定义好的三种类型的超边,提出加权超边结构,并通过加权超边结构解决用户与用户间的超链接预测问题;通过构造多种类型的超边结构挖掘节点间的隐含语义关系;
S421:加权超三角形结构,包括单加权超三角形结构、双加权超三角形结构和大加权超三角形结构;
单加权超三角形结构:通过时空节点与用户节点构成的单加权超三角形结构来计算用户节点间的相似性,表达两用户喜欢在相同时间相同的位置活动;定义的超边结构均为闭环结构,具有方向性;
双加权超三角形结构:指包含连续两个加权超三角形结构;
大加权超三角形结构:指由两条三类超边组成的三角形结构;
S422:加权超矩形结构:用户节点喜欢在两个相关的时空节点处活动,其权值为对应超边权值之积:
S423:加权超混合结构:包括加权超混合I结构,加权超混合II结构;定义分别为:
加权超混合I结构:混合I结构指在单三角形结构的基础上增加一条一类超边而组成的结构;
加权超混合II结构:混合II结构是指在矩形结构的基础上增加一条一类超边而组成的结构;
层次越深,关联链路越长,超边结构越丰富;
所述加权超边结构包括:加权超三角形结构、加权超矩形结构、加权超矩形结构和加权超混合结构;不同的结构对链接预测影响程度不同,因此其相似性表示为:
S(u,v)=θ1WS1(u,v)+θ2WS2(u,v)+......+θ19WS19(u,v)
其中θi为第i个加权超边结构的权重,通过梯度下降方法训练得到;参数更新过程为:
其中,θi-old表示迭代训练前的权值,θi-new表示迭代训练后的权值,λ表示学习步长,y表示用户间是否存在链接;当每个参数的变化值都小于某个阈值时,参数更新已收敛,得到最优参数集合θ+,最后利用最优参数集合θ+对用户间的链接关系进行预测,y值取1时,认为用户间的链接存在,否则认为用户间的链接不存在,其定义式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711182961.9/1.html,转载请声明来源钻瓜专利网。