[发明专利]基于用户画像聚类的协同过滤推荐方法、系统及存储介质有效
申请号: | 202011114490.X | 申请日: | 2020-10-16 |
公开(公告)号: | CN112307332B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 尚天淇;彭德中 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 高彬 |
地址: | 610044 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 画像 协同 过滤 推荐 方法 系统 存储 介质 | ||
本发明提供的基于用户画像聚类的协同过滤推荐方法、系统及存储介质,通过获取用户数据,包括属性数据和行为数据;对用户数据进行表征,形成用户表征信息;对用户表征信息进行降维压缩,形成低维用户画像;采用聚类方法对低维用户画像进行聚类,形成用户兴趣簇;对目标用户,在其所在的兴趣簇内采用基于用户的协同过滤方法对其进行推荐。考虑了用户行为随时间信息的变化,对用户的固有属性信息、用户过往行为和用户短期行为进行了自适应融合,并将用户按照低维用户画像进行聚类,根据聚类后的类别对用户进行基于用户的协同过滤推荐,能够兼顾效率和精度,降低了计算复杂度,保证了更高的推荐速度和准确率,实现了应对用户行为变化的自适应推荐。
技术领域
本发明涉及大数据人工智能技术领域,尤其涉及一种基于用户画像聚类的协同过滤推荐方法、系统及存储介质。
背景技术
随着互联网和自动技术的飞速发展,现在越来越多的人都拥有智能手机,平板电脑和其他智能终端,这使得生产、生活的数据信息呈爆炸式增长,这就导致了信息超载问题。当用户在搜索其感兴趣的信息时,会花费大量的时间和精力去过滤掉无用的信息,然而结果往往无法让用户满意,于是,个性化推荐技术应时而生。个性化推荐技术是指利用用户某种兴趣点和购买特点,向用户推荐感兴趣的内容,是解决信息超载问题的有效途径。在个性化推荐技术中,协同过滤推荐技术是最成熟,也是应用最广泛的一种技术。协同过滤简单来说是根据兴趣相投的用户群体来预测用户感兴趣的信息,并将其推荐给目标用户。但是由于用户和商品数的快速增长,传统的协同过滤推荐方法出现了冷启动、数据稀疏性、效率低下等问题。
为了改善传统协同推荐方法的性能,研究人员从以上问题出发对其进行研究。
针对数据稀疏性问题,通常对用户评分稀疏矩阵进行填充,并引入了相似性计算因子计算用户相似性;还可以采用矩阵分解算法对高维稀疏数据进行预处理,降低数据稀疏性。
针对冷启动问题,通常采用扩展用户本身固有属性的信息(如社交信息、属性信息等)融合入用户行为的协同过滤算法,有效缓解了用户冷启动问题。
针对效率低下问题,通过对用户评价矩阵进行分析,采用K-means聚类算法把兴趣和偏好相似程度较高的用户分到同一个簇中,以减少搜索最近邻的时间。
上述方法虽然在很大程度上解决部分问题,但是缺乏整体性,片面的追求效率或者准确性。
如专利公开号为CN106548255A提出的一种基于海量用户行为的商品推荐方法,该专利申请虽采用了聚类方法,但通常海量行为的超高维度,会造成聚类方法的相似度计算失效;而部分基于降维和聚类的协同过滤推荐算法,例如采用PCA和K-means相结合的方式对用户评分矩阵进行分析,虽然考虑了效率,但仍然存在冷启动问题,未考虑到用户行为变化问题。
对用户进行很好地表征是协同过滤推荐算法的关键和前提。尽可能多地利用用户数据是广为认可的思路,然而如何利用好这些数据是困难的。一方面,对不同的数据进行区别对待,特别是由于用户兴趣可能存在的变化,需要区分数据类型并进行恰当的处理;另一方面,对数据进行融合也不能简单地用数据拼接或者简单的加权算法来实现;此外,不恰当的数据融合可能导致更高维度的用户数据,不仅导致可能的维数诅咒问题使得计算失效,可能还会使得精妙设计的算法效率低下。
发明内容
本发明提供的基于用户画像聚类的协同过滤推荐方法、系统及存储介质,主要解决的技术问题是:如何对用户数据进行处理,以降低数据处理复杂度,且提升推荐的准确性。
为解决上述技术问题,本发明提供一种基于用户画像聚类的协同过滤推荐方法,包括:
S1:获取用户数据,包括属性数据和行为数据;
S2:对用户数据进行表征,形成用户表征信息;
S3:对所述用户表征信息进行降维压缩,形成低维用户画像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011114490.X/2.html,转载请声明来源钻瓜专利网。