[发明专利]用于面向排序的协同过滤的推荐方法和设备有效

专利信息
申请号: 200910207100.0 申请日: 2009-10-30
公开(公告)号: CN102053971B 公开(公告)日: 2011-05-11
发明(设计)人: 赵岷;刘楠 申请(专利权)人: 日电(中国)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;李辉
地址: 100007 北京市东城区东四十*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 面向 排序 协同 过滤 推荐 方法 设备
【说明书】:

技术领域

发明一般地涉及信息过滤,并且更具体地,涉及用于面向排 序的协同过滤的推荐方法和设备。

背景技术

随着互联网上可访问信息的爆炸性增长,帮助人们有效地筛选 大量信息的信息过滤技术变得不可或缺,以便能够克服由于所获得 的信息量过大而造成的信息过载问题。推荐系统就是这样一种信息 过滤技术,其基于用户过去的反馈,从大量数据项目中自动生成项 目推荐列表以供用户选择和参考。

构成推荐系统的现有技术一般分为基于内容的过滤和协同过滤 两大类。相比较于基于内容的过滤,协同过滤不需要关于项目的任 何内容信息,其通过收集大量用户对项目的反馈(如评分),并且 基于其他用户的偏好模式向用户做出推荐。除了避免需要收集广泛 的关于项目或用户的内容信息以外,协同过滤不要求特殊的领域知 识并且其容易被应用在不同的推荐系统中。因此,协同过滤已经成 为当前推荐系统中普遍使用的算法。

推荐系统的任务是根据用户兴趣生成项目的排序列表,用户最 感兴趣的项目应当被排在该列表的顶部。对于项目排序,大多数的 协同过滤算法首先预测用户对该项目的评分,然后利用评分对项目 进行排序。然而,此类基于评分预测的协同过滤算法由于在评分预 测方面不总是与排序有效性相一致、在排序中未将多个项目间的关 系纳入考虑而存在预测准确度不高的缺陷。

在例如互联网搜索的许多交互式应用中,评分形式的显式用户 反馈经常是难以获得的,而收集大量如用户点击的隐式反馈是很容 易的,从中可以容易地提取用户关于项目的成对偏好。因此,针对 偏好的模型是更加通用的,其可以处理隐式和显式的用户反馈。

在针对偏好的模型中,N.N.Liu和Q.Yang在国际信息检索年会 2008(SIGIR-08)上发表了Eigenrank:一种用于协同过滤的面向排序 的方法。该论文提出一种称为EigenRank的基于邻域的协同过滤算 法,其将协同过滤视作排序问题而不是评分预测问题。该基于邻域 的方法执行某些形式的最近邻搜索,通过融合用户邻居的偏好来产 生针对用户的排序推荐列表。经验表明这种面向排序的方法可以产 生比传统的评分预测方法更好的排序。

尽管基于邻域的方法因为概念上简单并且直观而被广泛使用, 但此类方法也存在不足。第一,基于邻域的方法的准确性通常不是 最佳的。第二,尽管基于邻域的方法可以产生预测,但它们并不涉 及太多的学习,因而只能从数据中获得很少的关于用户或项目的知 识。第三,基于邻域的方法经常要求在预测时直接操纵整个训练数 据集,这会造成很大的计算开销。最后,因为没有合适的模型,采 用基于邻域的方法来优化与特定任务或应用领域相关联的不同对象 是困难的。

发明内容

本发明所要解决的技术问题之一是提供一种能够使用观测到的 用户对项目对的偏好来直接预测用户对其他项目的偏好排序,从而 不需要对整个偏好数据库进行搜索而即时地做出排序预测。

为了解决上述的技术问题,根据本发明的一个方面,提供一种 用于面向排序的协同过滤的推荐方法。该方法可以包括:获取用户 对排序的项目对的偏好数据;根据所述偏好数据以及用户和项目相 关数据,构建基于用户偏好的概率潜在偏好分析模型;以及利用所 述概率潜在偏好分析模型,预测基于用户偏好的项目排序,以便向 用户进行推荐。

根据本发明的另一方面,提供一种用于面向排序的协同过滤的 推荐设备。该设备可以包括:获取装置,用于获取用户对排序的项 目对的偏好数据;构建装置,用于根据所述偏好数据以及用户和项 目相关数据,构建基于用户偏好的概率潜在偏好分析模型;以及预 测装置,用于利用所述概率潜在偏好分析模型,预测基于用户偏好 的项目排序以便向用户进行推荐。

根据本发明的用于面向排序的协同过滤的推荐方法和设备,可 以使用观测到的用户对项目对的偏好(即,排序对)来训练预测排 序模型,从而可以经由模型预测排序而不用像基于邻域的方法那样 在整个偏好数据库中进行搜索,这显著地降低了计算成本。另外, 尽管在该预测排序过程中涉及到可以在离线时完成的额外的模型构 建阶段,但通过将全部的数据压缩进非常紧凑的统计模型,可以做 出即时的排序预测。此外,通过设计合适的损失函数和优化程序, 模型可以被系统地调整从而适应不同领域的应用。

优选地,当训练数据是评分集合而非排序对集合时,可以根据 不同的策略从评分集合自动地产生合适的排序对集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910207100.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top