[发明专利]用于面向排序的协同过滤的推荐方法和设备有效
申请号: | 200910207100.0 | 申请日: | 2009-10-30 |
公开(公告)号: | CN102053971B | 公开(公告)日: | 2011-05-11 |
发明(设计)人: | 赵岷;刘楠 | 申请(专利权)人: | 日电(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;李辉 |
地址: | 100007 北京市东城区东四十*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 面向 排序 协同 过滤 推荐 方法 设备 | ||
技术领域
本发明一般地涉及信息过滤,并且更具体地,涉及用于面向排 序的协同过滤的推荐方法和设备。
背景技术
随着互联网上可访问信息的爆炸性增长,帮助人们有效地筛选 大量信息的信息过滤技术变得不可或缺,以便能够克服由于所获得 的信息量过大而造成的信息过载问题。推荐系统就是这样一种信息 过滤技术,其基于用户过去的反馈,从大量数据项目中自动生成项 目推荐列表以供用户选择和参考。
构成推荐系统的现有技术一般分为基于内容的过滤和协同过滤 两大类。相比较于基于内容的过滤,协同过滤不需要关于项目的任 何内容信息,其通过收集大量用户对项目的反馈(如评分),并且 基于其他用户的偏好模式向用户做出推荐。除了避免需要收集广泛 的关于项目或用户的内容信息以外,协同过滤不要求特殊的领域知 识并且其容易被应用在不同的推荐系统中。因此,协同过滤已经成 为当前推荐系统中普遍使用的算法。
推荐系统的任务是根据用户兴趣生成项目的排序列表,用户最 感兴趣的项目应当被排在该列表的顶部。对于项目排序,大多数的 协同过滤算法首先预测用户对该项目的评分,然后利用评分对项目 进行排序。然而,此类基于评分预测的协同过滤算法由于在评分预 测方面不总是与排序有效性相一致、在排序中未将多个项目间的关 系纳入考虑而存在预测准确度不高的缺陷。
在例如互联网搜索的许多交互式应用中,评分形式的显式用户 反馈经常是难以获得的,而收集大量如用户点击的隐式反馈是很容 易的,从中可以容易地提取用户关于项目的成对偏好。因此,针对 偏好的模型是更加通用的,其可以处理隐式和显式的用户反馈。
在针对偏好的模型中,N.N.Liu和Q.Yang在国际信息检索年会 2008(SIGIR-08)上发表了Eigenrank:一种用于协同过滤的面向排序 的方法。该论文提出一种称为EigenRank的基于邻域的协同过滤算 法,其将协同过滤视作排序问题而不是评分预测问题。该基于邻域 的方法执行某些形式的最近邻搜索,通过融合用户邻居的偏好来产 生针对用户的排序推荐列表。经验表明这种面向排序的方法可以产 生比传统的评分预测方法更好的排序。
尽管基于邻域的方法因为概念上简单并且直观而被广泛使用, 但此类方法也存在不足。第一,基于邻域的方法的准确性通常不是 最佳的。第二,尽管基于邻域的方法可以产生预测,但它们并不涉 及太多的学习,因而只能从数据中获得很少的关于用户或项目的知 识。第三,基于邻域的方法经常要求在预测时直接操纵整个训练数 据集,这会造成很大的计算开销。最后,因为没有合适的模型,采 用基于邻域的方法来优化与特定任务或应用领域相关联的不同对象 是困难的。
发明内容
本发明所要解决的技术问题之一是提供一种能够使用观测到的 用户对项目对的偏好来直接预测用户对其他项目的偏好排序,从而 不需要对整个偏好数据库进行搜索而即时地做出排序预测。
为了解决上述的技术问题,根据本发明的一个方面,提供一种 用于面向排序的协同过滤的推荐方法。该方法可以包括:获取用户 对排序的项目对的偏好数据;根据所述偏好数据以及用户和项目相 关数据,构建基于用户偏好的概率潜在偏好分析模型;以及利用所 述概率潜在偏好分析模型,预测基于用户偏好的项目排序,以便向 用户进行推荐。
根据本发明的另一方面,提供一种用于面向排序的协同过滤的 推荐设备。该设备可以包括:获取装置,用于获取用户对排序的项 目对的偏好数据;构建装置,用于根据所述偏好数据以及用户和项 目相关数据,构建基于用户偏好的概率潜在偏好分析模型;以及预 测装置,用于利用所述概率潜在偏好分析模型,预测基于用户偏好 的项目排序以便向用户进行推荐。
根据本发明的用于面向排序的协同过滤的推荐方法和设备,可 以使用观测到的用户对项目对的偏好(即,排序对)来训练预测排 序模型,从而可以经由模型预测排序而不用像基于邻域的方法那样 在整个偏好数据库中进行搜索,这显著地降低了计算成本。另外, 尽管在该预测排序过程中涉及到可以在离线时完成的额外的模型构 建阶段,但通过将全部的数据压缩进非常紧凑的统计模型,可以做 出即时的排序预测。此外,通过设计合适的损失函数和优化程序, 模型可以被系统地调整从而适应不同领域的应用。
优选地,当训练数据是评分集合而非排序对集合时,可以根据 不同的策略从评分集合自动地产生合适的排序对集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910207100.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二自由度并联平台机构
- 下一篇:抛物面天线样板安装调整方法及其装置