[发明专利]一种基于连续评分的推荐系统加权相似性度量方法有效
申请号: | 202110804730.7 | 申请日: | 2021-07-16 |
公开(公告)号: | CN113468229B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 董云泉;张壮壮 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 徐博 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 连续 评分 推荐 系统 加权 相似性 度量 方法 | ||
本发明是一种基于连续评分的推荐系统加权相似性度量方法,通过获取物品对用户重要性程度和用户对物品喜爱程度,然后与评分加权获得用户相似度和物品相似度,具体步骤如下:步骤1,获取数据,形成对数据进行预处理,将其转换成M*N的矩阵R;步骤2,获取用于度量物品对用户的重要性的权重矩阵;步骤3,获取用于度量用户对物品的重要性权重矩阵;步骤4,将权重矩阵和权重矩阵通过相似度度量,获得用户和物品相似度。该方法根据用户对物品的喜爱程度不同和物品对用户的重要程度不同,区别对待用户和物品,将两种重要性权重应用于常见相似度度量上,以此获得更准确的相似度,从而提高推荐精度。
技术领域
本发明涉及大数据和数据挖掘技术领域,具体的说是一种基于连续评分的推荐系统加权相似性度量方法。
背景技术
在基于邻域的协同过滤推荐方法中,用户(物品)之间相似性的度量是影响推荐性能的关键。在广泛使用的相似度量中,如余弦相似度,皮尔逊相关系数,欧氏距离倒数,Jaccard相似系数,用户和物品被平等对待。也就是说,每个相同评分的用户(物品)的使用和处理没有区别。然而,在日常生活中,我们经常观察到某个用户更喜欢某些物品,而有些用户对某项物品更加忠诚。
基于这种偏好,在实际评分数据中,评分经常是连续的,不同的分数本身就是一种权重,表示用户(物品)的偏好不同,然而用户许多评分往往是相同的,这使得推荐系统判断用户的兴趣爱好变得困难,在实际评分前加上一个权重系数,可将评分细化,可得到更准确的相似度。
发明内容
本发明要解决的技术问题是提供一种基于连续评分的推荐系统加权相似性度量方法,根据用户对物品的喜爱程度不同和物品对用户的重要程度不同,区别对待用户和物品,将两种重要性权重应用于常见相似度度量上,以此获得更准确的相似度,从而提高推荐精度。
为解决上述技术问题,本发明采用的技术方案为:
一种基于连续评分的推荐系统加权相似性度量方法,其特征在于:通过获取用户对物品喜爱程度和物品对用户重要性程度,然后加权获得用户相似度和物品相似度,具体步骤如下:
步骤1,获取数据,形成对数据进行预处理,将其转换成M×N的R矩阵;矩阵R中,第i行、第u列的元素riu表示用户u对物品i的评分;
步骤2,获取用于度量物品对用户的重要性的权重矩阵η;
步骤3,获取用于度量用户对物品的喜爱程度的权重矩阵ρ;
步骤4,将权重矩阵η和权重矩阵ρ分别与用户评分矩阵R加权,通过传统的相似度度量,分别获得用户加权相似度和物品加权相似度。
步骤1中首先获取不同用户对不同物品的评分数据,对原始数据进行预处理,原始数据预处理方式包括数据清洗,转化;具体为对数据中的异常值、缺失值进行删除或者填充,并将评分信息转化为用户对物品评分矩阵形式。
步骤2和步骤3中,权重矩阵η每列元素值为用户评分矩阵R对应位置除以该列和,权重矩阵ρ是每行元素为用户评分矩阵R对应位置除以该行和。
权重矩阵η用于度量不同物品对同一用户的重要性;权重越大表示物品对用户越重要,所有物品对同一用户的重要性权重之和为1。
M×N的权重矩阵η中ηi→u={η}iu,0≤ηi→u≤1且由定义可知,ηi→u越大,物品i对用户u越重要;可得到
ηi→u表示物品i对用户u的重要程度,Iu表示用户u的评价物品集合。
权重矩阵ρ来度量不同用户对同一物品的喜爱程度,权重越大表示用户越喜爱物品,所有用户对同一物品的喜爱权重之和为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110804730.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种甲醇重整制氢反应器及其制氢方法
- 下一篇:热泵式储能供电方法及装置