[发明专利]一种基于用户偏好相似度加权的协同过滤推荐方法在审
申请号: | 201910671741.5 | 申请日: | 2019-07-24 |
公开(公告)号: | CN110427567A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 张赛赛;王超;李佳霖;于海;王莹;朱志良 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加权 用户偏好 构建 相似矩阵 协同过滤 用户集合 相似度 标签 评分相似度 余弦相似度 标签集合 公式计算 计算公式 偏好矩阵 评分矩阵 权重计算 提升系统 线性加权 用户标签 可信度 预测 偏好 权重 算法 统计 | ||
本发明公布了一种基于用户偏好相似度加权的协同过滤推荐方法。其特征是:步骤1建立用户与项目之间的评分矩阵,并统计出用户集合与标签集合;步骤2通过标签权重计算公式计算出每一个用户中所有项目标签所占的权重,并构建用户标签偏好矩阵;步骤3利用余弦相似度计算出每一个用户与其余用户的评分相似度,并构建评分相似矩阵与偏好相似矩阵;步骤4近邻用户选择,并构建近邻用户集合;步骤5利用线性加权计算公式计算预测评分。本发明借鉴基于用户和项目加权的推荐算法,在最后预测评分进行加权,能够扩大用户偏好对最终推荐结果的影响,从而提升推荐结果的准确性,提升系统的可信度和用户的忠诚度。
技术领域
本发明涉及推荐算法技术领域,尤其涉及一种基于用户偏好相似度加权的协同过滤推荐方法。
背景技术
从目前的研究情况来看,很多学者在推荐系统中都考虑到用户偏好的影响,大部分情况都是在计算用户相似度时加权,修正用户与用户的相似度,并且取得了较大的成果。用户基于用户偏好加权的推荐算法,其基本思想是利用数据挖掘等技术对用户属性及历史偏好进行深入挖掘和分析,获取用户的偏好知识;利用获取的数据建立相应的偏好矩阵,然后根据偏好矩阵计算用户之间的相似度,最后和协同过滤的用户相似度加权从而修正用户偏好对最后推荐结果的影响,提高推荐算法的精确度。
基于用户偏好相似度加权的推荐算法在实验中相比于传统的协同过滤有一定的优化,但优化的程度有限,经过思考发现抑制其优化结果的条件有两点,偏好矩阵的构建和加权后的相似度值的修正,因此对这两点提出相应的改进,建立偏好矩阵时,不应该只统计用户评分过标签出现的次数,应该进一步考虑用户对项目的评分,因此计算标签权重是需要融入评分的影响,这样更能反映用户的偏好程度;另外一点是用户与用户之间的相似度虽然通过偏好加权的方式来修正,但是相似度只是一个中间量,后续还会根据相似度来选择近邻以及计算预测评分等,在经过一系列运算后,相似度的修正值影响度会随之下降,因此可以放弃在计算相似度的时候进项偏好加权,借鉴基于用户和项目加权的推荐算法,在最后预测评分进行加权。
发明内容
本发明的目的是针对上述现有技术的不足,提供一种基于用户偏好相似度加权的协同过滤方法,将用户评分融入偏好模型,使得偏好矩阵更加具有说服力,能够扩大用户偏好对最终推荐结果的影响,从而提升推荐结果的准确性,提升系统的可信度。本发明的技术方案是:
一种基于用户偏好相似度加权的协同过滤推荐方法,具体步骤如下:
步骤1:建立用户与项目之间的评分矩阵R,从评分矩阵R中统计出用户集合,记为U={u1,u2,...,um},m表示用户集合中用户的数量,项目集合I={I1,I2,...,In},其中n表示项目数量,根据项目信息统计出所有出现过的标签集合,记为L={l1,l2,...,lg},其中g表示标签数量,用户评分为给定的一个评分区间,且满足用户评分越高,表示用户越喜欢;
步骤2:根据评分矩阵R通过标签权重计算公式计算出每一个用户u中所有项目标签l所占的权重Wul,然后通过权重Wul构建用户标签偏好矩阵W;
用户u喜欢的项目标签l所占的权重Wul计算公式如下:
其中J表示用户u评价过的项目集合,L表示所有出现过的标签集合,Cil表示在项目i中标签l出现的次数,Rui表示用户u对项目i的评分,Ci表示项目i中标签的总数量,Tu为用户u评价过的项目总评分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910671741.5/2.html,转载请声明来源钻瓜专利网。