[发明专利]一种基于因子分解机的多任务时序推荐方法有效
申请号: | 202111667759.1 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114282687B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 卢暾;应亦周;顾宁;李东胜;张鹏 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 因子 分解 任务 时序 推荐 方法 | ||
本发明属于时间序列推荐技术领域,具体为基于因子分解机的多任务时序推荐方法。本发明具体步骤为:根据不同的推荐任务需求处理数据并得到相似性矩阵;将用户静态特征和根据相似性矩阵筛选出的动态特征作为模型静态任务和动态任务的输入;不同任务经过嵌入层、注意力机制、因子分解交互层、线性层得到最终给结果;根据结果和损失更新模型参数,不断训练直至达到收敛停止条件;保存模型,在新数据中加载模型并得到TOPN推荐结果。本发明着力提高因子分解机模型在时序推荐场景中的实用性和准确性,将多任务、注意力机制等与因子分解机相结合,从而提升因子分解机在现实时序推荐任务中的效果。
技术领域
本发明属于时间序列推荐技术领域,具体涉及基于因子分解机的多任务时序推荐方法。
背景技术
因子分解机(Factorization Machine)[1]是推荐领域中最为经典的推荐方法,由Steffen Rendle于2010年提出,解决了大规模稀疏数据的特征组合问题,相较于传统的线性回归(LR)和SVM类[2]算法,其推荐效果有显著提升。为了更好地捕捉特征之间的交互,因子分解机衍生处理许多变体,比如NFM[3]、DeepFM[4]、xDeepFM[5]等。
然而现实应用场景中随着电商行业、音乐娱乐的兴起,用户行为的时序性日趋重要,因此,时序推荐近年来引起业界内外广泛关注,其核心问题是围绕用户行为的时序性进行推荐模型的设计。传统因子分解机以及其对应深度和宽度扩展的方法都没有考虑时序信息,同时,现有的大多数序列推荐算法都将重点放在顺序动作之间的传递结构以及历史事件对当前预测的影响上,比如ARMA[6]、RNN[7]、GRU[8]等经典模型,很大程度上会忽略用户固定的上下文信息、这些信息之间的特征交互以及这些信息和时间特征之间的交互,并且长序列的特征传递需要较大的数据存储空间并造成大规模的计算量。
发明内容
本发明的目的在于提供一种计算量小、推荐效果好的基于因子分解机的时间序列推荐方法。
本发明提出的基于因子分解机的时间序列推荐方法,将原始因子分解机模型[1]的一阶、二阶交互和时序模型[9]相结合,一方面能够学习非时序性特征的上下文信息,另一方面能够学习时间序列所蕴含的时序信息,同时又能够将两部分信息结合进一步学习以提升推荐效果,从广度和深度的多维角度解决原始因子分解机在时序推荐上表现欠佳的问题。具体步骤如下。
步骤1:将原始数据整理并拆分为用户非时序的静态上下文和历史时间序列信息,在此基础上生成用户-物品矩阵;其中,将用户输入特征分为用户静态特征和用户时序特征两部分:[s1,s2,...,sn,d1,d2,...,dm,target];
其中,s为英文static的首字母,总共有n维,表示非时序特征,d为英文dynamic的首字母,代表时序特征,总共有m维,target表示目标物品。
步骤2:根据步骤1中的用户-物品矩阵按照cosine(余弦)相似性对步骤1中分割出的时间序列进行重要性筛选,在有限的时序输入长度内保留最相关的时间序列:
式中,sim为相似性函数,I为物品,I1,I2表示两种物品,r表示评分,分别为用户a,用户b对某个物品i的评分。
步骤3:对非时序特征和筛选过后的时序特征进行二维特征嵌入:
Estatic=Embedding(Dfeature,Dembedding)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111667759.1/2.html,转载请声明来源钻瓜专利网。