[发明专利]基于集成回归的个性化推荐算法在审
申请号: | 201910573458.9 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110297978A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 琚生根;李思骏;周志钢;李磊;胡思才 | 申请(专利权)人: | 四川金蜜信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q30/06 |
代理公司: | 成都三诚知识产权代理事务所(普通合伙) 51251 | 代理人: | 成实;饶振浪 |
地址: | 610000 四川省成都市中国(四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 样本 个性化推荐 用户数据 学习器 初始权重 推荐系统 影响因子 选择池 回归 准确率 遍历 涵盖 记录 | ||
本发明公开了一种基于集成回归的个性化推荐算法,其特征在于,包括以下步骤:步骤1:获取用户数据集,将用户数据集中每一个用户归为一个样本,遍历样本列表,记录样本的总数量N,并给每一个样本赋上初始权重d0;步骤2:集成若干个基础推荐算法,形成弱学习器选择池,并生成基础推荐算法列表k等步骤。本发明通过集成多个不同的基础推荐算法形成涵盖了各种不同影响因子的强学习器来解决同一个问题,提高了推荐系统的泛化能力,进而提升最终的推荐准确率。
技术领域
本发明涉及信息处理技术领域,具体提供一种基于集成回归的个性化推荐算法。
背景技术
推荐系统是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。影响推荐系统的推荐准确率的因素多样化,自从协同过滤推荐(CF推荐)算法出现以后,很多学者投入大量的精力针对该算法所应用的各类平台以及算法所出现的突出问题对协同过滤推荐算法进行改进和优化。但是现有的推荐算法基本上只针对某一种影响因子进行改进和优化,其泛化能力偏低;同时,现有的集成回归算法中的弱学习器之间仍存在一定的相关性,对所生成的强学习器会带来负面影响,这就极大的降低了推荐的准确率。
发明内容
本发明的目的在于克服上述缺陷,提供一种能够提高泛化能力,进而提升推荐准确率的基于集成回归的个性化推荐算法。
本发明通过下述技术方案来实现:一种基于集成回归的个性化推荐算法,包括以下步骤:
步骤1:获取用户数据集,将用户数据集中每一个用户归为一个样本,遍历样本列表,记录样本的总数量N,并给每一个样本赋上初始权重d0;
步骤2:集成若干个基础推荐算法,形成弱学习器选择池,并生成基础推荐算法列表;
步骤3:根据样本的初始权重进行迭代运算生成一个弱学习器,并将生成的弱学习器从弱学习器选择池中挑出,每一次迭代运算所挑出的弱学习器集合成弱学习器集;
步骤4:根据弱学习器对样本的权重进行更新,以更新后的权重作为下一次迭代的样本权重;
步骤5:根据生成的弱学习器产生强学习器;
步骤6:通过该强学习器对用户项目进行评级,评级高的则作为推荐对像,得出推荐结果。
进一步的,所述步骤3中生成弱学习器包括以下步骤:
(1)计算每个样本的误差值erri;其中,|ui|为用户ui所介入的项目数量,l表示用户ui所评价项目的编号,t为当前的迭代次数,i为样本序号,hkt(xil)表示弱学习器选择池中第k个基础推荐算法在第t次迭代中对样本的评级预测值,yil表示第i个用户所对应的第l个项目的用户评级;
(2)根据样本的误差值erri计算出弱学习器选择池中每个基础推荐算法的误差值ξkt,并将误差值最小的基础推荐算法从弱学习器选择池中挑出作为本次迭代的弱学习器;其中,ξkt=∑idit-1f(erri),dit-1为第i个样本在第t-1次迭代时所获得的权重,
所述步骤4中包括以下步骤:
A、计算所生成的弱学习器针对用户u的代价函数Rt(ui),计算公式为:
B、计算所生成的弱学习器的边界γt,计算公式为:其中,-1≤γt≤1,di,t-1为第i个样本第t-1次迭代运算所获得的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川金蜜信息技术有限公司,未经四川金蜜信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910573458.9/2.html,转载请声明来源钻瓜专利网。