[发明专利]基于单源SimRank的协同过滤推荐方法有效
申请号: | 201910577524.X | 申请日: | 2019-06-28 |
公开(公告)号: | CN110287424B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 魏哲巍;何晓东;王涵之;萧小奎;王思博;刘钰;杜小勇 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 北京中誉威圣知识产权代理有限公司 11279 | 代理人: | 周际;李秀琴 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 simrank 协同 过滤 推荐 方法 | ||
本发明公开了一种基于单源SimRank的协同过滤推荐方法,包括:将待推荐用户、用户以及用户间的关系转换为图结构,根据从源节点u出发的随机游走经过l步到达节点w并停止的概率πl(u,w)、从节点w出发的两条随机游走在行走过程中不再相遇的概率η(w)以及从节点w出发的反向游走经过l步到达节点v并停止的概率πl(v,w)来进行节点u、v之间的SimRank相似度的估计,重复执行相似度的估计,直至完成图结构中所有节点与源节点u之间的估计;根据估计结果,找到与待推荐节点相似度最高的前k个节点;获取前k个节点的行为信息,将行为信息整合推送给源节点u。本实施例提供的基于单源SimRank的协同过滤推荐方法,降低了时间复杂度,满足实时推荐、交互查询的需求。
技术领域
本发明是关于协同过滤推荐,特别是关于一种基于单源SimRank的协同过滤推荐方法。
背景技术
推荐系统作为电子商务、社交网络分析、个性化广告投放、用户兴趣推荐等多个领域的核心技术,在互联网发展的浪潮中重要性日益凸显。
根据已有的历史数据,分析用户的兴趣和需求,将其感兴趣的信息、产品、服务等推荐给用户的个性化信息系统称为推荐系统。根据推荐算法的不同,我们可以将其划分为基于协同过滤的推荐、基于内容的推荐、混合推荐三种。其中,基于协同过滤的推荐由于不需预先获得用户或物品的特征数据,仅依赖于用户的历史行为对用户进行建模,有很强的可移植性,得到了人们的广泛使用。具体的,在面向社交网络的推荐系统中,可以根据已有的好友关系,为指定用户推荐与其相似程度较高的用户,还可以将相似用户喜欢的商品推荐给目标用户,以扩展推荐系统的适用场景,提升推荐系统的鲁棒性和可移植性。
在协同过滤推荐方法的执行过程中,需要进行图节点相似度的计算和比较。如何准确地定义图节点的相似度并且能对之进行高效的计算,一直是研究者们持续探索的问题。为了方便具体问题的抽象和定义,我们将社交网络转化为图论中的图结构G=(V,E),其中,V、E分别表示图结构上的所有节点、边组成的集合,对应于实际社交网络中的用户群体和用户之间的好友关系。因此,可以将寻找社交网络上相似用户的实际问题转化为计算图结构上节点之间相似度的抽象问题。
在节点相似度定义方法中,SimRank相似度作为图节点相似度计算领域的一种重要算法,因为其定义完全基于图结构、不依赖于其他额外特征,并借助迭代的形式整合了节点多阶邻居的环境信息等优良特性,引起了人们的重点关注。下面为SimRank的基本定义式:
基于此,本申请的发明人发现,由于SimRank迭代定义的性质,直接计算单源节点的SimRank需要耗费O(td2n2)的时间复杂度和O(n2)的空间复杂度,这里t表示迭代次数,d表示图上节点的平均度数,n表示图节点的个数。
而随着大数据时代的到来,现实生活中产生的图结构规模越来越大,比如上亿用户的微信、推特(Twitter)形成的社交网络等,根据原始定义计算SimRank的时间复杂度太高,很难在有效时间内计算出大图上的单源SimRank的结果,无法满足实时推荐、交互查询的需求。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种基于单源SimRank的协同过滤推荐方法,其能够在有效时间内计算出大图的单源SimRank的结果,满足实时推荐、交互查询的需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910577524.X/2.html,转载请声明来源钻瓜专利网。