[发明专利]融合时间衰减因子的改进LFM协同过滤方法在审
申请号: | 201911356412.8 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111199422A | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 甘志刚;饶屾;余长宏;余斌霄;蒋晓宁 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06F40/30 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 时间 衰减 因子 改进 lfm 协同 过滤 方法 | ||
本发明提供融合时间衰减因子的改进LFM协同过滤方法,包括如下步骤:S1)输入用户u,每个用户u评价过的物品i,用户对物品i评价的时间戳,物品分类数K;S2)从训练样本中获得用户u评价过的物品,数量为Sp,作为正样本;S3)从训练样本中获得用户u没有评价过的物品,数量为Sn,作为负样本,用正、负样本构建用户u的训练样本库;S4)构建引入时间衰减因子的LFM算法的损失函数,通过梯度下降法,用训练样本库进行求解,得出用户u的用户特征矩阵P和物品特征矩阵Q;S5)计算用户u对物品i的兴趣度;S6)对所有物品兴趣度进行排序,选出N个兴趣度最高且用户u没有评价过的物品,给用户u进行推荐。
技术领域
本发明涉及互联网大数据处理技术领域,具体涉及一种融合时间衰减因子的改进LFM协同过滤方法。
背景技术
随着信息技术与和互联网的发展,我们已经进入到了一个“信息过载”的时代。面对五花八门的各类商品,铺天盖地的广告信息以及飞速增长的新闻信息,当用户不能明确自己需求或是不能准确描述自己需求的时候,我们就需要推荐系统来分析用户的历史行为给用户的兴趣建模,从而主动给用户推荐能够满足他们需求和兴趣的信息。
区别于搜索引擎系统,推荐系统可以以个性化的方式帮助用户从海量数据中快速找到自己感兴趣的对象。传统的基于用户和基于物品的协同过滤算法在基于用户行为计算相似度的时候需要主观定义分类的粒度、维度以及权重,存在数据的稀疏性和可展性等问题,所以预测评分结果的准确率和计算效率都不够高。
推荐算法的好坏直接决定了推荐系统性能的优劣。在推荐系统的众多算法中,基于内容的过滤(Content-based filtering,CBF)与协同过滤(Collaborative filtering)在实践中得到了最广泛的应用。协同过滤算法根据是否需要计算相似度可以分为基于邻域方法和基于模型的方法两类。基于邻域的推荐方法有两类,一类是基于用户的协同过滤算法(UserCF),这种算法从用户的兴趣相似出发,给用户推荐与其兴趣相似的其他用户喜欢的物品;另一类是基于物品的协同过滤算法(ItemCF),就是直接给用户推荐和他之前喜欢的物品相似的物品。UserCF是推荐用户所在兴趣小组中的热点,更注重社会化,而ItemCF则是根据用户历史行为推荐相似物品,更注重个性化。所以UserCF一般用在新闻类网站中,如Digg,而ItemCF则用在其他非新闻类网站中,如Amazon、hulu等。基于邻域的这两种方法为了衡量用户或者项目之间的相似性,需要存储两个用户共同的相关项目数据或两个项目共同的相关用户数据,当用户、项目的历史交互数据数量非常庞大的时候,扫描项目集合计算项目的相似性信息需要较长的时候,算法的扩展性不好,另一方面,交互数据量越大,潜在的可能性也更多,数据的稀疏性问题也将导致计算出的相似性指标可靠性降低。
基于模型的协同过滤算法是利用统计学、机器学习、数据挖掘来进行研究,将原始的评分数据进行训练得到相应的预测模型,模型的优劣直接影响着预测结果,其中应用较多的有聚类、贝叶斯以及隐语义模型。隐语义模型把用户和物品映射到相同的隐语义空间,通过隐含特征把用户的兴趣和物品进行关联,这些隐含的特征可以解释用户的喜好。
LFM(Latent factor model)隐语义模型从数据自身出发,采取基于用户行为的自动聚类,并利用机器学习的方法从用户的历史评分数据中挖掘出隐含特征。但当数据量很大的时候,用户-评分矩阵存在数据稀疏性问题,并且用户的兴趣总是随时间在不断改变,物品自身也是具有一定的生命周期的。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911356412.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于激光诱骗的光电跟踪设备
- 下一篇:一种数据开放综合管理系统