[发明专利]资源推荐方法、装置、存储介质及设备在审
申请号: | 201810395012.7 | 申请日: | 2018-04-27 |
公开(公告)号: | CN110210691A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 卢欣 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/16 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初始矩阵 目标矩阵 资源推荐 维数 存储介质 矩阵分解 评分数据 耗时 近似 分解 采样条件 目标资源 内存溢出 大数据 构建 预设 转换 失败 | ||
本发明公开了一种资源推荐方法、装置、存储介质及设备,属于大数据技术领域。方法包括:获取评分数据,并将评分数据转换为初始矩阵,初始矩阵中的每个元素为一个用户对一个目标资源的评分;基于初始矩阵以及过预设采样条件,获取初始矩阵的近似基;基于初始矩阵以及近似基,构建目标矩阵,目标矩阵的维数小于初始矩阵;基于目标矩阵,获取对初始矩阵的矩阵分解结果,基于矩阵分解结果进行资源推荐。本发明通过上述步骤将初始矩阵的维数大幅缩减,实现了将初始矩阵缩减至一个维数很低的目标矩阵,进而利用目标矩阵完成对初始矩阵的分解,不但耗时较短,而且不会出现因内存溢出而导致的分解失败情况,所以该种资源推荐方式耗时较短,效果较佳。
技术领域
本发明涉及大数据技术领域,特别涉及一种资源推荐方法、装置、存储介质及设备。
背景技术
矩阵分解,是指将一个矩阵分解成两个或多个矩阵的乘积。SVD(Singular ValueDecomposition,奇异值分解)作为一种矩阵分解算法,目前已经应用在诸如推荐系统、隐形语义分析和数据降维等多个领域。其中,SVD实现了将任意矩阵分解成奇异值矩阵Σ、左奇异向量U以及右奇异向量V的乘积。以推荐系统为例,在推荐领域中SVD主要用于减小协同过滤算法的计算量,由于协同过滤算法主要依靠用户之间的相似性或资源之间的相似性来进行推荐,所以相似性计算是协同过滤算法的重点。然而,当评分矩阵大到一定程度时,相似性计算的计算量便会非常庞大,其中,评分矩阵记录了不同用户对不同资源的评分。此时便需要采用SVD来分解评分矩阵以实现降维,之后,便可利用矩阵分解结果计算用户相似性和资源相似性,进而基于相似性结果完成资源推荐。
相关技术中,在资源推荐过程中进行矩阵分解时主要是基于Spark Mllib包中提供的SVD分解方式实现,详细过程为:以分布式方式存储待分解的矩阵A,为了避免直接计算格莱姆矩阵G=ATA时容易产生的内存溢出问题,相关技术根据Lanczos算法原理,通过迭代方式逐步计算G与矩阵A的右奇异向量V的乘积,得到三对角矩阵;之后,通过Arpack算法,计算该三对角矩阵的奇异值矩阵与右奇异向量,然后再根据公式U=AVΣ-1得到矩阵A的左奇异向量U,至此便完成了将矩阵A分解成为奇异值矩阵Σ、左奇异向量U和右奇异向量V三者的乘积。
针对上述在资源推荐过程中涉及的矩阵分解方式,为了使Arpack算法达到收敛,需要不断的计算G与右奇异向量V的乘积,当遇到矩阵A的特征值下降非常缓慢或者需要求取的奇异值个数较大的时候,在Arpack算法达到收敛前往往需要迭代运算很多轮,这将导致得到的三对角矩阵非常大,很容易导致内存溢出,从而致使资源推荐失败;此外,该种矩阵分解过程也非常耗时,致使进行资源推荐耗时过长。
发明内容
本发明实施例提供了一种资源推荐方法、装置、存储介质及设备,解决了相关技术中存在的因矩阵分解过于耗时以及内存容易溢出从而导致的资源推荐效果不佳的问题。所述技术方案如下:
一方面,提供了一种资源推荐方法,所述方法包括:
获取评分数据,所述评分数据中包括用户对目标资源的评分;
将所述评分数据转换为初始矩阵,所述初始矩阵中的每个元素为一个用户对一个目标资源的评分;
基于所述初始矩阵以及过预设采样条件,获取所述初始矩阵的近似基;
基于所述初始矩阵以及所述近似基,构建目标矩阵,所述目标矩阵的维数小于所述初始矩阵;
基于所述目标矩阵,获取对所述初始矩阵的矩阵分解结果,所述矩阵分解结果包括描述用户特征属性的第一矩阵和描述目标资源特征属性的第二矩阵;
基于所述矩阵分解结果进行资源推荐。
在另一个实施例中,所述基于所述正交向量Q0以及所述初始矩阵,构建q轮的迭代过程,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810395012.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理