[发明专利]协同过滤推荐方法、装置及设备在审
申请号: | 202110943918.X | 申请日: | 2021-08-17 |
公开(公告)号: | CN115705340A | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 王琦;黄新安;仇明 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司;中移动信息技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/9535;G06F16/9536 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 协同 过滤 推荐 方法 装置 设备 | ||
1.一种协同过滤推荐方法,其特征在于,所述方法包括:
获取大数据平台的用户历史行为数据,并存储至分布式文件系统;
对存储在所述分布式文件系统中的所述用户历史行为数据进行相似性度量及多阶段并行进行处理,生成待推荐项目集;
将所述待推荐项目集中的项目推荐至目标用户。
2.根据权利要求1所述的方法,其特征在于,所述待推荐项目集为基于目标项目的待推荐项目集;所述对存储在所述分布式文件系统中的所述用户历史行为数据进行相似性度量及多阶段并行进行处理,生成待推荐项目集的步骤,进一步包括:
根据所述用户历史行为数据处理,寻找所述目标用户喜欢的项目数据;
寻找与所述目标用户喜欢的项目数据相似的项目数据,生成所述待推荐项目集。
3.根据权利要求2所述的方法,其特征在于,所述目标用户喜欢的项目数据包括:项目与项目相似度矩阵,所述根据所述用户历史行为数据处理,寻找所述目标用户喜欢的项目数据的步骤,进一步包括:
对存储在所述分布式文件系统中的所述用户历史行为数据进行并行处理,得到用户与项目评分矩阵;
对所述用户项目评分矩阵进行相似度度量及并行处理,得到项目与项目相似度矩阵。
4.根据权利要求3所述的方法,其特征在于,所述寻找与所述目标用户喜欢的项目数据相似的项目数据,生成所述待推荐项目集的步骤,进一步包括:
对所述项目与项目相似度矩阵进行相似度度量及并行处理,得到所述目标项目与其他项目之间的相似度矩阵;
根据所述目标用户的用户与项目评分矩阵与所述目标项目与其他项目之间的相似度矩阵,生成基于所述待推荐项目集。
5.根据权利要求3所述的方法,其特征在于,所述对所述用户项目评分矩阵进行相似度度量及并行处理,得到项目与项目相似度矩阵的步骤,进一步包括:
通过引入时间因子的相似性度量方法对所述用户项目评分矩阵进行并行处理,得到所述项目与项目相似度矩阵。
6.根据权利要求5所述的方法,其特征在于,所述时间因子的公式包括:
其中,α为时间衰减因子,tui表示用户i对物品u产生行为的时间,tuj表示用户j对于物品u产生行为的时间。
7.根据权利要求5所述的方法,其特征在于,当采用皮尔逊相关系数作为所述相似性度量的衡量标准时,所述时间因子的公式包括:
其中,Uij表示用户i、j均有评分的项目集,即Ui和Uj的交集;rui和ruj表示用户i、j对项目u的评分;ri和rj表示用户i、j已有评分项目的平均评分。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述将所述待推荐项目集中的项目推荐至目标用户的步骤,进一步包括:
确定所述待推荐项目集中所含项目个数是否大于预设阈值N;
当所述待推荐项目集中所含项目个数大于预设阈值N时,使用Top-N的推荐策略生成推荐列表;
将所述推荐列表推荐至所述目标用户。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
当所述待推荐项目集中所含项目个数不大于预设阈值N时,统计所述目标用户的用户历史行为数据中产生评分数据最多的前N个项目,得到top-N个热门项目;
将所述top-N个热门项目填充至所述待推荐项目集中,然后返回执行所述确定所述待推荐项目集中所含项目个数是否大于预设阈值N的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司;中移动信息技术有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司;中移动信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110943918.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:艾塞那肽变体及其聚乙二醇缀合物的制备方法
- 下一篇:一种糕点模具激光清洗台