[发明专利]基于相似性传递的协同过滤方法及系统有效

申请号：	201310221379.4	申请日：	2013-06-05
公开（公告）号：	CN103309967B	公开（公告）日：	2016-10-26
发明（设计）人：	谢峰;陈震;许宏峰;曹军威	申请（专利权）人：	清华大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	王莹
地址：	100084 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及推荐技术领域，特别涉及基于相似性传递的协同过滤方法及系统。本发明所采用的方法：遍历所有用户的历史行为数据，获得描述所有用户对物品过往喜好的关系向量；应用关系向量设定阈值，计算各个用户间的相似性；利用相似性传递计算原则计算前述矩阵中相似性值为零的目标用户与其他用户间相似性；根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值；对每个用户的预测结果进行筛选，产生对每个用户的推荐物品。本发明的系统包括以下模块：数据关系向量模块；阈值判定模块；相似性传递计算模块；喜好程度估值模块；预测筛选模块。
搜索关键词：	基于相似性传递协同过滤方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于相似性传递的协同过滤方法，其特征在于，该方法包含以下步骤：1)遍历所有用户的历史行为数据，获得描述所有用户对物品过往喜好的关系向量；2)应用关系向量，并设定阈值，根据阈值临界原则计算各个用户间的相似性并得到大小为用户数×用户数的初始相似性矩阵；3)根据初始相似性矩阵中不为零的相似性值，利用相似性传递计算方法计算前述矩阵中相似性值为零的目标用户与其他用户间相似性，最终得到更密集的相似性矩阵；采用以下公式获取更密集的相似性矩阵：

<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><mi>U</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow></mfrac><munder><mo>Σ</mo><mrow><mi>w</mi><mo>&Element;</mo><mi>U</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></munder><mo>(</mo><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>w</mi><mo>)</mo></mrow><mo>×</mo><mfrac><mrow><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>w</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow><mrow><munder><mo>Σ</mo><mrow><mi>z</mi><mo>&Element;</mo><mi>U</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow></munder><msup><mi>sim</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>w</mi><mo>,</mo><mi>z</mi><mo>)</mo></mrow></mrow></mfrac><mo>)</mo></mrow>

公式中，U(u,v)表示同时与用户u和用户v之间的初始相似程度不为零的用户集合，|U(u,v)|表示同时与用户u和用户v之间的初始相似程度不为零的用户数目，若数目为零，则sim(u,v)＝0，U(w)表示与用户w之间的初始相似程度不为零的用户集合；sim^l(u,v)表示用户u和用户v之间的相似程度；sim^l(w,v)表示用户w和用户v之间的相似程度；sim^l(w,z)表示用户w和用户z之间的相似程度；4)根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值；5)对每个用户的预测结果进行筛选，产生对每个用户的推荐物品。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310221379.4/，转载请声明来源钻瓜专利网。

上一篇：一种重复数据删除方法和设备
下一篇：一种网络舆情事件多维信息提取的方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于相似性传递的协同过滤方法及系统有效

专利文献下载