[发明专利]一种基于深度学习的个性化推荐方法有效
申请号: | 201910456019.X | 申请日: | 2019-05-29 |
公开(公告)号: | CN110196946B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 郭炜强;平怡强;张宇;郑波 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 个性化 推荐 方法 | ||
1.一种基于深度学习的个性化推荐方法,其特征在于,包括以下步骤:
1)用户观看电影的历史行为特征数据预处理;
2)个性化推荐模型建模
2.1)嵌入层设计;
2.2)一维卷积网络层设计;
2.3)自注意力机制;
对于卷积层的输出的向量序列,计算每个向量的自注意力,得到每个向量不同权重值,最后加权求和得到输出状态信息;在实际的实现中,以矩阵形式完成的,以便能更快进行处理;对于给定的输入序列X,将输入值通过不同的线性变换分别得到查询矩阵Q、键矩阵K、值矩阵V:
Q=WQX
K=WKX
V=WVX
式中,WQ,WK,WV分别为对应于查询矩阵Q,键矩阵K,值矩阵V的变换矩阵;然后用Q、K计算评分,利用softmax函数将其结果归一化为权重分布,再乘以值矩阵V得到加权求和表示:
式中,Z为最终的输出矩阵,d为变换矩阵的维度,上标T为矩阵转置操作;选择输出矩阵中最后一个向量作为输出值;
在此,使用多头自注意力,多头自注意力是使用多组不同的权重矩阵对输入数据变换,生成不同的多组查询、键和值,相当于是并行的多个自注意层,这样通过计算多次来捕获不同子空间的相关信息,最后多组自注意力再进行拼接,由于拼接操作会造成维度扩展,再进行一次降维的线性变换,恢复为之前的维度,使用多头注意力机制,每个自注意力层重点关注的部分是不一样的;
2.4)分类输出层与损失函数设计;
对于自注意力层的输出的状态信息,送入全连接的输出层,全连接层的激活函数使用softmax,softmax能够将多个神经元分别输出,各自映射至(0,1)的区间内,所有输出的累加和为1,满足概率的性质,因此能够将每个输出看成相对应分类的概率来理解,从而进行分类;总分类的数量即为总电影的数量,最终选择概率最高的多部生成推荐列表,损失函数使用分类交叉熵,其公式如下:
式中,用loss表示损失,n为样本数,m为分类数;i表示样本中索引位置,j表示分类即向量中元素的索引位置,yij为实际元素值,y'ij为预测元素值;当yij为1时,计算损失,y'ij越接近于1,则损失越小,当yij为0时,则不考虑y'ij造成的损失;
3)使用用户时序行为特征序列进行模型训练和测试。
2.根据权利要求1所述的一种基于深度学习的个性化推荐方法,其特征在于:在步骤1)中,将数据集中的评分信息数据按照每个用户分组,再按照时间戳进行排序,只关注用户与电影交互的隐性反馈,即只关心用户是否观看了某部电影,而不关心其评分;对于每个用户都有其相应的电影观看序列;随后对电影数据进行编码表示,电影ID使用独热编码表示,使用与电影数量相同维度的向量进行表示;对于每部电影,只激活电影ID相应位置的数据,即该位标1,其余位置为0;电影信息编码向量,作为每个用户观看序列中一个条目的数据。
3.根据权利要求1所述的一种基于深度学习的个性化推荐方法,其特征在于:在步骤2.1)中,全连接的嵌入层使用一个权重矩阵来对电影信息编码向量进行降维,用于将高维稀疏向量映射到低维密集向量,并使用非线性激活函数,学习特征之间的非线性关系,提取到特征表示信息;权重矩阵的形式为m×n,其中m为稀疏向量的维度,n为密集向量的维度,且m要大于n;嵌入层看做是重新对原始数据进行降维编码,而编码的规则是通过在网络中训练权重而自动生成的。
4.根据权利要求1所述的一种基于深度学习的个性化推荐方法,其特征在于:在步骤2.2)中,使用多组卷积核为长度分别为1、2、3、4的一维卷积核进行卷积运算,同时运用因果卷积技术,经过卷积并使用激活函数后,将对应时间步的不同卷积核的输出结果进行拼接,生成拼接结果的时间序列,输出序列长度等于输入的序列长度,序列中每个时间步的输出向量维度等于4种长度卷积核数量之和。
5.根据权利要求1所述的一种基于深度学习的个性化推荐方法,其特征在于:在步骤3)中,将数据集划分训练集、验证集与测试集,使用预处理的训练集和验证集中用户观看序列进行模型训练,然后使用测试集进行测试,预测下一部用户可能观看的电影,评价标准使用召回率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910456019.X/1.html,转载请声明来源钻瓜专利网。