[发明专利]一种面向众智平台的改进随机游走图模式推荐算法在审
申请号: | 201910170656.0 | 申请日: | 2019-03-07 |
公开(公告)号: | CN109978657A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 李建强;李倩 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q40/06 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机游走 相似度 权重 算法 时间效应 物品寻找 协同过滤 稀疏性 构建 个性化 改进 网络 聚焦 覆盖率 挖掘 | ||
本发明提出一种面向众智平台的改进随机游走图模式推荐算法。该方法主要聚焦在物品网络上,根据得到的基于时间效应的协同过滤的物品之间的相似度,构建物品网络,将相似度作为游走的权重,多次游走,可以挖掘出物品与物品之间的联系,为物品寻找出更多的相似物品,克服数据的稀疏性,提升丰富性和覆盖率。权重的加入也使得推荐结果更具个性化。
技术领域
一种面向众智平台的改进随机游走图模式推荐算法属于数据挖掘领域。
背景技术
目前的很多数据存在着一定的稀疏性,传统的算法很难挖掘出准确的相似用户或者相似物品来进行预测和推荐。对于数据集中用户的行为数据,因为理财产品数量较多,有些理财产品之间没有共同用户,这就会导致很难为目标物品找到足够相似的物品。但在实际场景中,如果两个物品共享同一相似物品,则根据相似关系的传递性,它们之间也可能相似。因此,通过挖掘物品之间的间接相似关系,可以有效地缓解直接相似关系的稀疏性问题。
图是一种抽象程度高、表达能力强的数据结构,它通过对节点和边的定义来描述实体和实体之间的关联关系。用户行为是一个天然的网络图,边和节点往往有着各种丰富的信息,图具有传播能力,通过随机游走可以挖掘多度关系,能有效的提升覆盖度,扩大召回。
近年来,图模型中的随机游走在克服数据稀疏性问题上取得了较好的效果。它可以看作是一个描述随机游走者访问顶点序列的马尔可夫链,当游走者访问顶点序列的马尔可夫链,当游走达到稳态后,每一个节点被访问的概率即为该节点的得分。
现有技术的步骤:
(一)构建二分图模型
基于图的模型(graph-based model)是推荐系统中的重要内容。在研究基于图的模型之前,首先需要将用户行为数据表示成图的形式。我们的用户行为数据是由一系列二元组组成的,其中每个二元组(u,i)表示用户u对物品i产生过行为。对于这样的数据集很容易用一个二分图表示。
如图1所示,它是一个简单的用户物品二分图模型,其中圆形节点代表用户,方形节点代表物品,圆形节点和方形节点之间的边代表用户对物品的行为。比如图中用户节点A和物品节点a、b、d相连,说明用户A对物品a、b、d产生过行为。
(二)得到物品的访问概率
上一步中,我们将用户的行为表示为二分图模型。下一步就是在二分图上给用户进行个性化推荐。如果将个性化推荐算法放到二分图模型上,那么给用户u推荐物品的任务就可以转化为度量用户顶点vu和与vu没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就越高。
首先介绍一下度量二分图中两个顶点之间相关性的方法。主要包括以下三个因素:
(1)两个顶点之间路径的数量。两个顶点之间的路径数量越多,说明这对顶点的相关性就更高。
(2)两个顶点之间路径的长度。如果连接两个顶点之间的路径长度都比较短,那么这两个顶点的相关性就比较高。
(3)两个顶点之间的路径经过的顶点。如果连接两个顶点之间的路径不会经过出度比较大的顶点,那么他们的相关性也会比较高。
举一个简单的例子,如图2(a)所示,用户A和物品c、e没有边相连,但是用户A和物品c有1条长度为3的路径相连,用户A和物品e有2条长度为3的路径相连。那么,顶点A与e之间的相关性要高于顶点A与c,因而物品e在用户A的推荐列表中应该排在物品c之前,因为顶点A与e之间有两条路径如图2(b)和图2(c)所示,分别是(A,b,C,e)和(A,d,D,e)。其中,(A,b,C,e)路径经过的顶点的出度为(3,2,2,2),而(A,d,D,e)路径经过的顶点的出度为(3,2,3,2),某节点的出度是指由该顶点指向其他节点的边的个数。因此,(A,d,D,e)经过了一个出度比较大的顶点D,所以(A,d,D,e)对顶点A与e之间相关性的贡献要小于(A,b,C,e)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910170656.0/2.html,转载请声明来源钻瓜专利网。