[发明专利]一种用于推荐系统的计算机数据挖掘方法有效
申请号: | 201210193229.2 | 申请日: | 2012-06-12 |
公开(公告)号: | CN102750360A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 王建民;丁贵广;龙明盛;姜晓伟 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/16 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于推荐系统的计算机数据挖掘方法,属于计算机数据处理技术领域。首先在计算机的主服务器中初始化用户偏好矩阵和服务项目偏好矩阵,将用户输入的偏好矩阵的行向量分发给计算机中的多个映射器,各映射器分别计算用户偏好矩阵和服务项目偏好矩阵的梯度方向的子方向,并将计算结果发送给计算机中的化简器,化简器对接收的梯度方向的子方向进行累加,并根据用户偏好矩阵和服务项目偏好矩阵的梯度方向矩阵,对用户偏好矩阵和服务项目偏好矩阵进行更新。本发明方法对已有的PMF算法进行了改进,提高了大规模数据处理能力;采用键值对的数据存储结构储存偏好矩阵,使得占用的储存空间更小,数据读取速度更快。 | ||
搜索关键词: | 一种 用于 推荐 系统 计算机 数据 挖掘 方法 | ||
【主权项】:
1.一种用于推荐系统的计算机数据挖掘方法,其特征在于该方法包括以下步骤:(1)设定一个N×M的偏好矩阵R,其中N为偏好矩阵R的行数,N等于用户个数,M为偏好矩阵R的列数,M等于为用户服务的项目个数;(2)向计算机输入文件,将输入文件转换成映射化简模型中的序列文件,使序列文件中的每一行为偏好矩阵R的一个行向量,偏好矩阵R的每一行的数据结构为:行向量下标和键值对数组组成,其中键值对数组包括服务项目编号和用户对该服务项目的偏好;(3)将偏好矩阵R表示为R=UTV,其中UT为N×D的用户偏好矩阵的转置,N等于用户个数,D为用户服务项目偏好因子个数,V为D×M的服务项目偏好矩阵,M为服务项目个数;(4)在计算机的主服务器中生成用户偏好矩阵U和服务项目偏好矩阵V,其中用户偏好矩阵U的行为用户编号,列为用户偏好因子,初始化时用户偏好因子为任意实数,服务项目偏好矩阵V的行为服务项目编号,列为服务项目偏好因子,并设初始化时服务项目偏好因子为任意实数;(5)将上述偏好矩阵R的行向量分发给计算机中的多个映射器,各映射器根据读取的偏好矩阵R的行向量,分别根据公式:▿ U ik = λ U U ik + Σ j = 1 M I ij V j ( R ij - g ( U i T V j ) ) g ′ ( U i T V j ) , ]]> 计算用户偏好矩阵U中每个元素的梯度方向▽Uik,根据公式:Δ ( ▿ V ik ) = I ij U i ( R ij - g ( U i T V j ) ) g ′ ( U i T V j ) , ]]> 计算服务项目偏好矩阵V中每个元素的梯度方向的子方向Δ(▽Vik),其中,表示用户偏好矩阵U的转置的第i个行向量,Vj表示服务项目偏好矩阵V的第j个行向量,λU是用户指定的用户偏好程度参数,λU为正实数,Uik为用户偏好矩阵U的第i行、第k列的元素,I为指示函数矩阵,若Iij等于0,则表示用户i未对服务项目j产生偏好,若Iij等于1,则表示用户i对服务项目j产生偏好,g是罗杰斯特函数,g’是g函数的一阶导函数:g ( x ) = 1 1 + e - x ]]> 各映射器将梯度方向▽Uik和梯度方向子方向Δ(▽Vik)分别发送给计算机中的化简器;(6)化简器根据接收的服务项目偏好矩阵V中每个元素的梯度方向的子方向Δ(▽Vik)进行累加,得到矩阵V的每个元素的梯度方向▽Vik,其中λV是用户指定的服务项目偏好程度参数,λV是正实数;(7)化简器构建一个用户偏好矩阵U的梯度方向矩阵▽U,梯度方向矩阵▽U中第i行、第k列的值为步骤(5)计算得到的▽Uik,构建一个服务项目偏好矩阵V的梯度方向矩阵▽V,梯度方向矩阵▽V中第i行、第k列的值为步骤(5)计算得到的▽Vik;并根据用户偏好矩阵U的梯度方向矩阵▽U和服务项目偏好矩阵V的梯度方向矩阵▽V,对用户偏好矩阵U和服务项目偏好矩阵V进行更新,使:U = U - ▿ U V = V - ▿ V , ]]> 完成一次迭代;(8)用户设定一个最大迭代次数,若迭代次数大于或等于最大迭代次数,则得到用户偏好矩阵U和服务项目偏好矩阵V,结束计算;若迭代次数小于最大迭代次数,则重复步骤(3)~步骤(8)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210193229.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种飞机辅助动力装置安装拉杆布局方法
- 下一篇:序批式苎麻无废生物脱胶方法