[发明专利]一种基于多核融合的新项目协同推荐方法在审
申请号: | 201910070714.2 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109840702A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 田斌 | 申请(专利权)人: | 山西开拓科技股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/9535 |
代理公司: | 北京君恒知识产权代理事务所(普通合伙) 11466 | 代理人: | 张强 |
地址: | 030006 山西省太原市小*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于商品属性信息的冷启动推荐算法,目的是通过利用多核加权融合的协同过滤算法解决新商品推荐中的数据缺失问题。该算法通过多核加权的方式确定了商品在属性空间之间关联关系,从而实现向用户推荐新项目。其中,所述的多核学习算法,是在现有的核函数学习算法的基础上,为各个核函数进行加权求和从而提高了算法在复杂数据环境中的准确度;所述的属性相似度,是通过计算在商品间属性上的相似性,使计算的用户对商品预测的偏好得分更具有解释性;所述的权重是通过随机梯度下降的学习方法进行优化。通过本发明,能够根据商品的属性信息学习一种描述用户偏好的项目相似性度量,以有效提高新项目推荐的精准度。 | ||
搜索关键词: | 多核 算法 新项目 学习算法 核函数 加权 商品属性信息 属性相似度 相似性度量 方式确定 复杂数据 关联关系 加权融合 商品推荐 商品预测 属性空间 属性信息 数据缺失 随机梯度 协同过滤 用户偏好 用户推荐 准确度 解释性 精准度 冷启动 求和 偏好 权重 协同 融合 学习 优化 | ||
【主权项】:
1.一种基于多核融合的新项目协同推荐方法,其特征在于,包括:步骤1、建立数据属性信息集,所述数据属性信息集包括:用户ID信息、项目ID信息、评分信息以及项目的属性信息;步骤2、提取评分信息大于0相对应的用户ID信息和项目ID信息,组成项目‑用户组,随机选取任一项目‑用户组进行计算;步骤3、根据项目的属性信息分别计算项目之间皮尔逊相似度、余弦相似度和Jaccard相似度,分别建立皮尔逊核、余弦核和Jaccard核;其中皮尔逊相似度中的近邻集合是两个项目的用户的集合的交集,如下分段函数是3种情况下,对n的判断(n是集合中元素的个数),
步骤4、计算皮尔逊核、余弦核和Jaccard核三个基本核函数的加权和,计算公式如下:![]()
式中,simi对应相应类型的核函数,wi分别是各个核函数占整体的权重,权重和为1,并且每个权重都大于等于0。步骤5、确定当前项目v的邻居集SN,具体包括5.1)计算项目之间属性的相似性5.2)找出当前用户u评论的所有评分项目集S5.3)选取项目集S中与当前项目v属性相似度的前K个项目,构成当前项目v的邻居集SNv,若如果不足K个按当前个数算,否则取相似度大的前K个步骤6、计算用户u对项目v的预测评分,计算公式如下:
式中SNv表示项v的K个最近的邻居;sim(v,j)是式
中的多核线性组合;rju(0≤rju≤5)是用户u在项目j上的评分值;步骤7、采用随机梯度下降的算法来优化损失函数,损失公式为:
式中P(v,u)是预测评分,y(v,u)是真实评分;求解损失函数包括以下步骤:7.1)将损失函数表示成梯度的形式:
7.2)计算
的值,计算过程为:
7.3)化简,令![]()
7.4)得到向量a、b,将向量a、b带入式
得到
的值;步骤8、计算损失如公式:
步骤9、对权重w进行归一化的处理,确保每次迭代后的wi加和为1,且wi都大于等于0;步骤10、根据公式w(n+1)=wn‑αη(0<α≤0.1)更新w。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西开拓科技股份有限公司,未经山西开拓科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910070714.2/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理