[发明专利]一种基于多源附加信息增强的混合标签推荐方法在审
申请号: | 202210031666.8 | 申请日: | 2022-01-12 |
公开(公告)号: | CN114491290A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陈震中;易静 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 附加 信息 增强 混合 标签 推荐 方法 | ||
1.一种基于多源附加信息增强的混合标签推荐方法,其特征在于,包括如下步骤:
步骤1,构建物品多源附加信息,包括内容信息和社交信息;
步骤2,定义标签推荐的概率图模型,得到潜在变量和观测变量的联合分布;
步骤3,构建MAVAE网络,利用块坐标提升算法求解潜在变量的后验分布;
构建的MAVAE网络包括物品协同Mult-VAE网络子模块、物品内容VAE网络子模块和物品社交网络VGAE网络子模块三部分,这三个部分均由编码器和解码器构成;
所述MAVAE网络利用块坐标提升算法来最大化证据下界ELBO,即通过固定一部分参数来求另一部分参数,该证据下界可以划分为Mult-VAE协同信息网络参数优化、VAE内容信息网络参数优化和VGAE社交信息网络参数优化,通过三部分优化不断迭代,联合训练得出所有的参数;
步骤4,随机初始化网络参数,对MAVAE网络进行训练;
步骤5,利用训练MAVAE网络得到的参数进行物品的标签推荐。
2.如权利要求1所述的一种基于多源附加信息增强的混合标签推荐方法,其特征在于:步骤1中多源附加信息包括物品的内容信息和社交信息;物品内容信息包括对物品的描述信息,通过词频-逆文档频率进行特征提取,从而为每个物品赋予一个内容特征;物品社交信息描述物品之间的链接关系,不同领域的物品有其自身的链接关系,用户对物品的共同交互关系也被用来描述物品之间的链接关系,通过定义具体的链接条件,物品的社交网络可以被构建;利用构建好的多源附加信息加上物品-标签的交互矩阵作为观测数据用来训练模型,从而实现对物品的标签推荐。
3.如权利要求1所述的一种基于多源附加信息增强的混合标签推荐方法,其特征在于:步骤2中概率图的生成过程定义如下:从正态分布中采样K维潜在低维空间中的潜在物品内容变量ci和潜在物品社交变量si,物品的内容由其潜在内容变量ci通过变分自编码器的生成网络生成,物品社交图由采样子图的潜在社交变量si通过变分图自编码器的生成网络生成;
为了综合利用物品多源附加信息,采用多头乘积原理融合多源附加变量,然后从多种分布的乘积分布中采样物品协同变量vi,通过神经网络参数化的非线性函数对物品协同变量vi进行转换,生成J个标签上的概率分布;
物品的交互从多项式分布中采样为:
π(ri)∝Softmax{NN(vi;θ)} (1)
ri~Multinomial(Ni,π(ri)) (2)
式中,π(ri)由神经网络NN(vi;θ)输出,并通过Softmax函数将输出标准化;vi是物品协同变量;θ是深度神经网络的训练权值;Ni为物品i的交互总数;Multinomial()表示多项式分布函数;ri从参数化的多项式分布中采样;
各变量的联合分布可表示为:
pθ(V,C,S,R,X,G)=pθ(X|C)p(C)pθ(G|S)p(S)p(V|C,S)pθ(R|V) (3)
式中,{R,X,G}为所有观测变量的集合,分别表示物品的交互矩阵、物品的内容矩阵和物品的社交图网络;{V,C,S}为所有需要推理的潜在变量的集合,分别表示物品潜在协同变量矩阵、物品潜在内容变量矩阵和物品潜在社交变量矩阵;pθ(X|C)p(C)表示物品内容观测变量X由物品内容潜在变量C的先验p(C)乘上其对物品内容的生成概率pθ(X|C)生成;pθ(G|S)p(S)表示物品社交图网络观测变量G由物品社交潜在变量S的先验p(S)乘上其对物品社交图的生成概率pθ(G|S)生成;p(V|C,S)pθ(R|V)表示物品交互矩阵观测变量R由物品潜在协同变量的生成过程p(V|C,S)乘上其对物品交互矩阵的生成概率pθ(R|V)生成;pθ(X|C)、pθ(G|S)和pθ(R|V)的生成过程由生成网络建模,θ是生成网络的参数;
通过定义的概率生成过程得到各变量的联合分布pθ(V,C,S,R,X,G),由于物品潜在协同变量和多个附加变量的生成过程是非线性的,因此利用变分推理的思想为每个变量的后验分布设定一个近似后验qφ(V,C,S|R,X,G),并使得近似后验与真实后验的相对熵最小,经验证最小化该相对熵等价于最大化证据下界ELBO;
ELBO的表示如下:
将式(3)联合分布公式带入式(4),得:
式中,pθ(X|C)表示根据物品内容潜在变量C生成物品内容观测变量X的生成过程,pθ(G|S)表示根据物品社交潜在变量S生成物品社交图观测变量G的生成过程,p(V|S)和p(V|C)分别表示由物品潜在社交变量S和物品潜在内容变量C生成物品潜在协同变量V的生成过程,pθ(R|V)表示根据物品社交潜在变量生成物品交互矩阵R的生成过程,KL(qφ(C|X)||p(C))表示物品内容潜在变量的变分后验与其先验的偏离程度,KL(qφ(S|G)||p(S))表示物品社交潜在变量的变分后验与其先验的偏离程度,表示qφ(V|R)的熵,本发明将其视为常数,变分后验的推理过程由神经网络参数化,φ是推理网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210031666.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置