[发明专利]一种基于变分自注意力网络的序列推荐方法在审
申请号: | 202010273754.X | 申请日: | 2020-04-09 |
公开(公告)号: | CN111506814A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 赵朋朋;赵静;周晓方;崔志明 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/16;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春辉 |
地址: | 215131 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 网络 序列 推荐 方法 | ||
1.一种基于变分自注意力网络的序列推荐方法,其特征在于,包括:
根据历史交互序列,生成输入嵌入矩阵,所述输入嵌入矩阵包括所述历史交互序列中各个项目的项目嵌入信息和位置嵌入信息;
将所述输入嵌入矩阵输入推断自注意力网络,得到自注意力向量,并根据所述自注意力向量确定变分参数;
利用重新参数化方法,根据所述变分参数确定潜在变量;
利用生成自注意力网络,根据所述潜在变量生成所述历史交互序列的表示,以作为用户偏好表示;
利用预测层根据所述用户偏好表示确定交互概率最大的候选项目,以作为推荐结果。
2.如权利要求1所述的方法,其特征在于,所述根据历史交互序列,生成输入嵌入矩阵,包括:
根据历史交互序列,生成输入嵌入矩阵,所述输入嵌入矩阵为:其中i∈(1,n),n表示序列长度,Ai表示第i个项目的项目嵌入信息,Pi表示第i个项目的位置嵌入信息。
3.如权利要求1所述的方法,其特征在于,所述将所述输入嵌入矩阵输入推断自注意力网络,得到自注意力向量,包括:
利用推断自注意力网络中的投射层,根据所述输入嵌入矩阵和推断投射矩阵,确定推断投射结果;
利用推断自注意力网络中第一预设数量的自注意力块,根据所述推断投射结果生成自注意力向量其中,h1为所述第一预设数量,n表示序列长度。
4.如权利要求3所述的方法,其特征在于,所述根据所述自注意力向量确定变分参数,包括:
根据所述自注意力向量,确定均值和方差,以作为近似后验分布qλ(z|Su)的变分参数,其中所述均值为所述方差为l1(·)表示线性变换,l2(·)表示另一种线性变换,λ表示变分自注意力网络的近似参数,Su表示所述历史交互序列,z表示所述潜在变量。
5.如权利要求4所述的方法,其特征在于,所述利用重新参数化方法,根据所述变分参数确定潜在变量,包括:
利用重新参数化方法,根据所述变分参数确定潜在变量,所述潜在变量为:z=uλ+σλ·ε,其中,ε表示标准高斯变量。
6.如权利要求5所述的方法,其特征在于,所述利用生成自注意力网络,根据所述潜在变量生成所述历史交互序列的表示,包括:
利用生成自注意力网络中的投射层,根据所述潜在变量和生成投射矩阵,确定生成投射结果;
利用生成自注意力网络中第二预设数量的自注意力块,基于条件分布pθ(Su|z),根据所述生成投射结果生成所述历史交互序列的表示其中,h2为所述第二预设数量,θ表示变分自注意力网络的真实参数。
7.如权利要求6所述的方法,其特征在于,所述利用预测层根据所述用户偏好表示确定交互概率最大的候选项目,以作为推荐结果,包括:
根据目标公式,利用预测层基于所述用户编号表示预测候选项目集合中交互概率最大的候选项目,以作为推荐结果,所述目标公式为:其中表示预测得到的用户u在t时间交互概率最大的候选项目,表示用户偏好表示的第t行,N表示所述候选项目集合中候选项目的数量,d表示向量维度。
8.如权利要求1-7任意一项所述的方法,其特征在于,还包括:
根据损失函数,对变分自注意力网络的真实参数和近似参数进行优化,所述损失函数为:
其中,y(u,t)表示用户u在t时间的实际交互项目,表示预测得到的用户u在t时间交互概率最大的候选项目,Su表示所述历史交互序列,θ和λ分别表示变分自注意力网络的真实参数和近似参数,σλj表示σλ的第j行,μλj表示uλ的第j行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273754.X/1.html,转载请声明来源钻瓜专利网。