[发明专利]一种基于离散多视图哈希的协同过滤推荐方法有效
申请号: | 201710199300.0 | 申请日: | 2017-03-29 |
公开(公告)号: | CN107122411B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 张寅;魏宝刚;王鸿阳 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高;傅朝栋 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 离散 视图 协同 过滤 推荐 方法 | ||
本发明公开了一种基于离散多视图哈希的协同过滤推荐方法,包括如下步骤:1)根据不同视图下的数据构建数据的多视图锚点图表示;2)结合协同过滤和锚点图,得到学习模型;3)对得到的学习模型进行求解,得到用户与物品对应的二进制哈希编码;4)利用得到的哈希编码进行最邻近搜索,计算特定用户对候选物品的偏好程度,返回偏好程度最大的若干个物品作为推荐结果。本发明将不同视图下的数据进行了整合,在求解的时候始终保持编码的离散特性,提高了推荐结果的质量。同时利用哈希编码实现了相似用户的快速搜索,提高了推荐结果计算的效率。
技术领域
本发明涉及个性化推荐技术,尤其涉及一种基于离散多视图哈希的协同过滤推荐方法。
背景技术
互联网产业的高速发展,带来了内容的爆炸性增长。为了帮助用户的有效获取信息,个性化推荐系统正发挥着越来越重要的作用。协同过滤技术是在推荐系统中广受关注的一类技术。与传统的基于内容直接过滤分析进行推荐不同,协同过滤利用大量的用户信息,选取与目标用户相似的用户,或是与目标物品相似的物品,来最终推荐当前目标用户的可能感兴趣的物品。
但是在现实的应用环境中,我们往往能够获取到除了评分之外的大量其他信息,包括用户与用户之间的社交关系,物品与物品之间的类别关系等。传统的协同过滤推荐技术往往只能利用单一视图下的用户信息,且需要通过高维向量之间的运算才能够计算出对用户偏好的预测评分,这严重影响了计算和存储效率,其常规解法也造成了大量的信息丢失。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于离散多视图哈希的协同过滤推荐方法。
本发明的目的是通过以下技术方案来实现的:
一种基于离散多视图哈希的协同过滤推荐方法,包括以下步骤:
1)根据不同视图下的数据,构建数据的多视图锚点图表示;
2)结合协同过滤和锚点图,得到学习模型;
3)对得到的学习模型进行求解,得到用户与物品对应的二进制哈希编码;
4)利用得到的哈希编码进行最邻近搜索,计算特定用户对候选物品的偏好程度,返回偏好程度最大的若干个物品作为推荐结果。
上述各步骤可采用如下具体实现方式:
步骤1)包括以下子步骤:
1.1)对于训练数据在第i个视图下的行为数据矩阵其中N表示第i个视图下的数据点的数量,di表示第i个视图下数据点的维度,利用K-means聚类方法生成Ti个聚类中心,作为该视图下数据的锚点,Ti的取值与数据点数量相关;
1.2)将不同视图下的训练数据进行水平连接得到矩阵其中M表示视图的数量,dtotal表示所有视图下数据的维度之和;
1.3)对于每个训练数据,搜索其在各视图下最近邻的若干个锚点,组成集合利用不同视图下的最近邻锚点集合构建对角矩阵其中表示第i个视图下j个锚点组成的集合,di表示第i个视图下数据的维度;
1.4)对于每个数据点,利用Nesterov梯度方法和投影梯度方法求解优化问题其中表示该数据点到所有最近邻锚点的转移概率,初值均为xi表示矩阵X的第i行;
1.5)将数据点到非最近邻锚点的转移概率设定为0,根据得到的各数据点到最近邻锚点的转移概率,得到所有数据点到所有锚点的转移概率矩阵其中Ttotal表示所有视图下锚点数量的总和,这个转移概率矩阵就是所构建的数据的多视图锚点图表示。
步骤2)包括以下子步骤:
2.1)计算得到转移概率矩阵P的列和向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710199300.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种缓存更新方法及装置
- 下一篇:一种海量电话号码快速匹配检索方法