[发明专利]一种基于用户特征的改进协同过滤推荐方法在审
申请号: | 201710425888.7 | 申请日: | 2017-06-08 |
公开(公告)号: | CN107329994A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 张蕾;曹艺迪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 特征 改进 协同 过滤 推荐 方法 | ||
技术领域
本发明涉及互联网领域,尤其涉及一种基于用户特征的改进协同过滤推荐方法。
背景技术
随着互联网的快速发展,信息的获取越来越便利,但面对如此庞大的信息量,仅凭人力是无法一一浏览并充分利用,个性化的推荐方法的研究应运而生。
协同过滤推荐算法是最早出现的一种推荐算法,其分支基于用户的协同过滤算法是最为常见的一种协同过滤算法,它因准确度较高而被广泛使用。
发明人在实现本发明的过程中,发现现有技术中至少存在以下缺点和不足:
传统的基于用户的协同过滤算法其用户相似度计算仅仅利用了用户的共同评分,忽略了许多其他方面的问题,例如:用户的价值尺度问题、用户的特征信息利用、以及对用户未共同评分项目的考虑等等,导致信息推荐的精度不高,无法满足实际应用中的多种需要。
发明内容
本发明提供了一种基于用户特征的改进协同过滤推荐方法,本发明提高了传统基于用户的协同过滤算法的推荐质量,并在一定程度上减轻数据稀疏性问题的影响,详见下文描述:
一种基于用户特征的改进协同过滤推荐方法,所述改进协同过滤推荐方法包括以下步骤:
根据所有用户平均评分对原有用户评分区间进行修正,利用修正后的用户评分区间均值和所有用户平均评分,对原有用户评分进行修正,获取归一化处理后的用户评分;
根据归一化处理后的用户评分对评分差均值进行调整和归一化,结合原Jaccard相似性系数得到改进后的Jaccard相似性系数,以此获取用户评分相似度;
通过用户的性别、年龄、职业特征信息,对用户属性相似度进行计算;
将用户评分相似度和用户属性相似度线性结合作为最终用户相似度,并进行近邻计算,生成推荐列表。
所述归一化处理后的用户评分统一了用户评价尺度,对于同一物品,若用户的喜爱程度相同,用户评分为均值k。
所述改进后的Jaccard相似性系数具体为:
其中,sim(u',v')Jaccard+为改进后的Jaccard相似性系数;sim(u',v')Jaccard为Jaccard相似性系数;Iu’v’为用户u’与用户v’共同评价的物品集合;N表示用户u’与用户v’共同评价的物品总数;l为调节因子,用于对评分差值产生的影响进行调节;rmax是评分规则中的最高分;rmin是评分规则中的最低分;Diff(u',v')为归一化处理后的评分差均值;Iu'为用户u’评价的物品集合;Iv'为用户v’评价的物品集合;ru'i为用户u’对物品i的评分;rv'i为用户v’对物品i的评分;i为物品。
所述通过用户的性别、年龄、职业特征信息,对用户属性相似度进行计算的步骤具体为:
simAttr(u,v)=a*sex(u,v)+b*age(u,v)+c*job(u,v)
其中,a是性别特征权重因子;b是年龄特征权重因子;c是职业特征权重因子;sex(u,v)位性别属性相似度;age(u,v)为年龄属性相似度;job(u,v)为职业属性相似度;u,v均为用户。
所述将用户评分相似度和用户属性相似度线性结合作为最终用户相似度,并进行近邻计算,生成推荐列表的步骤具体为:
根据最近邻的打分记录与目标用户的两两相似度进行分析;
分析结果即目标用户对未评分物品的预测评分;
将未评分物品按预测评分高低排序;选择评分最高的一些物品生成推荐列表。
本发明提出了一种新的推荐算法即结合用户特征的改进协同过滤推荐方法,它致力于统一用户评价尺度,使用效果更好的用户评分相似度计算方法,结合用户特征信息,使用户相似度计算更精确,间接地提高算法的推荐质量,其有益效果主要体现在以下三个方面:
(1)解决了传统算法用户评价尺度混乱的问题,使用户评分相似度计算的误差更小;
(2)采用改进Jaccard相似性系数方法[1],提高用户评分相似度的精确度;
(3)利用了用户特征信息,加入用户属性相似度,使最终用户相似度更加准确。
附图说明
图1为一种基于用户特征的改进协同过滤推荐方法的流程图;
图2为用户评价矩阵的示意图;
图3为用户相似度计算流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710425888.7/2.html,转载请声明来源钻瓜专利网。