[发明专利]基于物品分类和用户分类的协同过滤推荐方法有效
申请号: | 201210030236.0 | 申请日: | 2012-02-10 |
公开(公告)号: | CN102609523B | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 施荣杰;王守军 | 申请(专利权)人: | 上海视畅信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海愉腾专利代理事务所(普通合伙)31306 | 代理人: | 唐海波 |
地址: | 201699 上海市松江区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种协同过滤算法,具体地说是一种基于物品分类和用户分类的协同过滤推荐算法,其特征在于采用如下步骤A、物品的聚类与分类步骤;B、用户的聚类与分类步骤;C、物品聚类与用户聚类的融合步骤;D、排序推荐步骤。本发明同现有技术相比,用改进的KMEANS算法完成数据的聚类,方法简单,增加了可扩展性,同时解决了稀疏性问题、冷启动问题。 | ||
搜索关键词: | 基于 物品 分类 用户 协同 过滤 推荐 方法 | ||
【主权项】:
一种基于物品分类和用户分类的协同过滤推荐方法,其特征在于采用如下步骤:A、物品的聚类与分类步骤:首先,采用PCA分析方法鉴别物品的主要特征,即对整个物品集合所成的特征空间进行主轴定位,并得到PCA空间映射矩阵;其次,采用KMEANS算法完成数据的聚类,即对每个物品都定义一个特征向量,该特征向量涵盖了物品的主要特征标签,通过余弦距离度量公式计算每两个物品之间的相似度,其公式如下:Sim(V1,V2)=cosα=Σk=1n(v1k×w1k×v2k×w2k)(Σk=1n(v1k×w1k))(Σk=1n(v2k×w2k));]]>其中,V1,V2表示物品的特征向量:V1=(v11,v12,...,v1n),V2=(v21,v22,...,v2n);根据应用的不同,给每个特征项赋予一定的权重以表示该特征的重要程度,即:V1=(v11,w11;v12,w12;...;v1n,w1n),V2=(v21,w21;v22,w22;...;v2n,w2n);最后,在完成对物品的聚类后,记录每个类的类中心,当有新的物品加入时即可在PCA空间进行距离计算,把新物品分类到离它最近的类中心所代表的那个类别;B、用户的聚类与分类步骤:当系统积累的用户数据量足够时,即可根据用户的类别消费特征向量来为用户进行聚类和分类,其过程和上述物品的聚类与分类步骤是一样的;C、物品聚类与用户聚类的融合步骤:每个物品有了分类信息后,用户对物品的消费记录就可以转化为对类别的消费记录,从而使得用户消费特征的维度与类别的总数一致;D、排序推荐步骤:按照类内按相似度排序来进行推荐,或者按照用户的消费历史根据类别排序后再按比例进行相关类内物品排序来进行推荐,或者按照用户的类别来进行推荐,把同类其他用户的消费物品推荐给该用户;在步骤A中,所述的PCA分析方法为主成分分析算法,即Principal ComponentAnalysis,其为降维统计方法,通过正交变换,将分量相关的原表征向量转化成分量不相关的新表征向量,其方法如下:定义物品的加权特征向量为V=(v1,w1;v2,w2;...;vK,wK)T,其具备K个维度;现在取出n个物品:Vi=(vi1,wi1;vi2,wi2;...;viK,wiK)T,其中1≤i≤n;定义矩阵:计算物品在每个维度即属性上的均值:V‾=1nΣi=1nVi=(1n(Σi=1n(vi1wi1)),1n(Σi=1n(vi2wi2)),...,1n(Σi=1n(vikwik)))T]]>计算每个物品离开均值的距离,该距离相当于坐标轴原点平移:这里的I=(1,...,1)是一个长度为n列的行向量;计算这n个物品的协方差矩阵:计算矩阵C的特征向量和特征值:A‑1CA=D,其中,D表示C的特征值对角阵;A表示C的特征向量矩阵;对D和A按降序排列其中的特征值和特征向量,特征值的大小表征了主轴轴向上的物品属性的分离度,选取其中的前L个特征值和对应的特征向量:0≤L≤K,满足:Σi=1LλiiΣi=1Kλii≥95%]]>对应的,选取A的前L个特征向量:B=[Ai1,Ai2,...,AiL],其中,Aik(1≤k≤L)表示特征向量矩阵的某一列;对于任何一个新到的样本,通过下面的公式计算其在给定PCA空间中的新坐标,即新特征向量:Vn+1=BT(vn+1,1,wn+1,1;vn+1,2,wn+1,2;...;vn+1,K,wn+1,K)T。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海视畅信息科技有限公司,未经上海视畅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210030236.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种免烫整理剂及其制备方法
- 下一篇:裁切装置