[发明专利]一种基于改进因子分解机的个性化推荐方法在审
申请号: | 201910804120.X | 申请日: | 2019-08-28 |
公开(公告)号: | CN110727855A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 王艺航;熊晓明 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02;G06Q30/06;G06N3/04;G06N3/08 |
代理公司: | 44329 广东广信君达律师事务所 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 因子分解 关联特征 神经网络 序列特征 二阶 平方欧氏距离 神经网络模型 个性化推荐 改进 低阶特征 用户行为 端到端 计算量 度量 高阶 内积 权重 算法 一阶 | ||
本发明公开了一种基于改进因子分解机的个性化推荐方法,通过对因子分解机算法进行改进,将原始因子分解机模型中特征之间的交互强度的权重度量不再利用内积,而是利用平方欧氏距离,既传承了因子分解机本身具有的优点,又具有了提取序列特征的优势。另外,将改进后的因子分解机模型与深度神经网络结合,克服了因子分解机提取二阶以上关联特征计算量巨大的缺点,因子分解机模型负责提取低阶特征(即一阶及二阶特征)之间的关联特征及用户行为的序列特征,深度神经网络负责提取更高阶的特征,从而更加准确高效的进行推荐。最后,作为端到端模型,与其它神经网络模型相比,不需要特征工程的操作,更加方便。
技术领域
本发明涉及推荐算法的技术领域,尤其涉及到一种基于改进因子分解机的个性化推荐方法。
背景技术
随着大数据时代科技高速发展,用户通过互联网和电子产品获得的信息资源越来越丰富。每天有数以千万计的信息涌入生活,造成了”信息过载”的问题,用户经常需要从海量的商品中挑选出自己需要的,尤其在用户没有明确目标的情况下,挑选商品既费时又费力。如何从海量商品中快速且有针对性地对用户作出推荐便成为一个商机。鉴于这种情况,推荐系统应运而生。现如今已经有很多网站推出了“猜你喜欢”,“今日推荐”等功能,旨在给用户推荐符合心意的商品,如果这些推荐符合用户兴趣,则既可以增加网站利润和用户黏度;也可以节省用户获取自己想要物品的时间。因此推荐系统可谓是一种“双赢”的技术。而推荐算法作为推荐系统的核心,对推荐结果起着关键的作用,同时面临着极大的挑战,如何准确而迅速的为用户推荐符合心意的商品(这里的商品可以是音乐,电影,物品等)引起人们的思考。
其中,常见的推荐方法比如基于用户的协同过滤推荐方法和基于物品的协同过滤推荐方法,本质上与机器学习中的最近邻思想相似,但存在缺点:当用户数据和商品数据量增大的时候,运算负担十分大,准确率下降;无法提取无法提取用户行为数据中的隐含特征和序列特征。因此推荐效果不理想。
在深度学习领域,基于卷积神经网络的方法并未考虑用户行为数据的上下文相关的本质,提取到的特征并没有完全发挥深度学习的优势;基于循环神经网络的推荐方法可以提取序列特征,但是在数据处于高维且稀疏的情况下效果不佳。
发明内容
本发明的目的在于克服现有技术的不足,提供一种可以更好的提取数据的序列特征、隐含特征、低阶特征以及高阶特征,从而为用户进行更为精准推荐的基于改进因子分解机的个性化推荐方法。
为实现上述目的,本发明所提供的技术方案为:
一种基于改进因子分解机的个性化推荐方法,包括以下步骤:
S1.获取用户历史行为数据;
S2.将用户历史行为数据转换成用户数*物品数的矩阵格式,并进行one-hot编码处理;处理后的数据分为训练数据和测试数据;
S3.构建由因子分解机和深度神经网络组成的模型;
S4.通过步骤S2得到的训练数据对模型进行训练,得到优化模型;
S5.将步骤S2得到的测试数据输入到优化模型中,得出个性化推荐结果。
进一步地,所述步骤S3中,因子分解机的模型增添特征组合,具体如下:
上式中,特征Xi和特征Xj之间的关联特征权重Wij由特征Xi和特征Xj所对应的隐向量Vi和Vj的内积表示。
进一步地,将所述因子分解机中隐向量的内积改进为平方欧式距离;
具体为:通过学习每个特征Xi的嵌入向量和平移向量用平方欧氏距离代替内积来度量特征之间的交互强度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910804120.X/2.html,转载请声明来源钻瓜专利网。