[发明专利]一种融合异质信息网络的可解释推荐方法有效
申请号: | 202011276253.3 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112380434B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 王英;贾天浩;王鑫;左万利;杨伟英;左祥麟 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 李荣武 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 信息网络 可解释 推荐 方法 | ||
1.一种融合异质信息网络的可解释推荐方法,其方法如下所述:
(1)通过互联网获得含有丰富异质信息的真实数据集,分别处理数据集,抽取得到商品和用户的特征信息,和特征之间的关系信息:
1)通过互联网上推荐系统相关的网站获取公开的包含异质信息的推荐系统数据集;
2)对于异质信息推荐系统数据集中包含的实体特征:商品的评论、商品的描述,商品种类,商品价格,商品品牌和购买关系,根据不同的关系抽取成多个两两实体之间的相似度矩阵,矩阵前两列为两个实体的名字,第三列为实体之间关系的评分;
3)通过数据处理得到数据集中包含的实体数量和关系数量;数据集的稀疏程度通过密度得到表示,数据密度按如下公式计算的:
其中分子是评分数量,分母是用户数量与商品数量的乘积;
(2)对于的得到的特征信息和关系信息,利用元路径的方法组合,得到不同关系下的用户和商品的相似度矩阵,通过推荐系统中矩阵分解的方法对上述得到的多个相似度矩阵进行分解,得到在不同元路径下的用户和商品特征表示向量:
1)首先需要通过设计L条元路径;
2)对于设定的元路径,采用矩阵乘法可以得到对应的用户商品相似度矩阵,基于元路径的相似度矩阵是两个关系矩阵之间的矩阵乘法操作,MAn-1An表示实体类型An-1与实体类型An之间关系的相似度矩阵;
3)、得到L条元路径对应的用户商品相似度矩阵之后,使用矩阵分解来获得用户和商品的潜在表示,矩阵分解的优化目标函数:其中是通过用户和商品的表示向量矩阵相乘得到的预测矩阵,U代表用户喜好的潜在特征,B是商品含有的潜在特征,代表预测相似度矩阵;和是动态参数,用于控制傅里叶范数正则化影响以避免过拟合;
4)对于之前设计的L条元路径,通过实体关系矩阵乘法得到L个基于元路径的相似度矩阵,同时进行如上的矩阵分解操作,得到L组不同的用户和商品的特征表示U(1),B(1),U(2),B(2)…,U(L),B(L);
(3)对于不同元路径下的用户和商品特征表示向量,设计不同的注意力神经网络组合多个特征表示向量:
1)设计一个局部的注意力网络,局部注意力网络的目标是获得组合了L组不同路径信息的用户和商品表示UL和BL,对于L组用户表示ui,i∈L,将它们依次输入面向用户表示的注意力神经网络中,得到对应ui的注意力系数αi:
DNNu(ui)=Relu(WU*(Relu(…(ui)…))+BU)
其中DNNu(ui)是面向用户的注意力神经网络,它的输入是不同路径的用户表示向量,WU是神经网络全连接系数矩阵,BU是每一层的偏置,每层的激活函数都是Relu;然后通过softmax函数将神经网络的L个输出值归一化得到注意力系数αi,对于商品采用同样的操作可以得到对应不同路径下商品表示的注意力系数βi:
DNNb(bi)=Relu(WB*(Relu(…(bi)…))+BB)
之后,根据得到的注意力系数αi和βi分别组合L组路径的用户和商品表示得到组合L组不同路径信息的用户和商品表示UL和BL,将用户/商品表示乘以对应的注意力系数αi/βi,然后Concatenate操作直接拼接L组αi*ui/βi*bi:
UL=Concate(α1*u1||α2*u2…||αi*ui)
BL=Concate(β1*b1||β2*b2…||βi*bi)
最后,通过将用户和商品表示UL和BL拼接就可以得到用户和商品交互特征表示向量,即交互预测方法多层感知机的输入向量Plocal,如下所示:
Plocal=Concate(UL||BL)
=Concate(α1*u1||α2*u2…||αi*ui||β1*b1||β2*b2…||βi*bi);
2)设计一个全局注意力网络,首先将每一组路径对应的表示向量ui和bi拼接,得到对应路径的交互特征表示pi,pi=Concate(ui||bi),i∈L,然后将L组pi依次输入面向交互特征的注意力神经网络DNNZ中,得到对应的注意力系数θi:
DNNZ(pi)=Relu(WZ*(Relu(…(pi)…))+BZ)
其中DNNZ是多层的神经网络,输入是L组的交互特征表示pi,WZ、BZ、Relu分别是神经网络对应的全连接系数矩阵、层偏置项和激活函数,然后通过softmax函数将神经网络的L个输出值归一化得到注意力系数θi;
根据得到的注意力系数θi组合L组路径的交互特征表示pi得到组合不同路径信息的用户和商品交互特征表示Pglobal,将L组路径的交互特征表示pi乘以对应的注意力系数θi,然后通过Concatenate操作直接拼接L组θi*pi:
Pglobal=Concate(θ1*p1||θ2*p2…||θi*pi);
3)、设计实体向量表示的交互方法,将基于局部注意力网络的交互特征表示Plocal和基于全局注意力网络的交互特征表示Pglobal组合在一起采用组合方式有如下两种:
P=λ1*Plocal+λ2*Pglobal
P=Concate(λ1*Plocal||λ2*Pglobal)
其中λ1∈(0,1)和λ2∈(0,1)是参数,用于决定每一部分信息的保留,第一中方法是将局部的交互特征表示Plocal和全局的交互特征表示Pglobal相加,第二种方法是将二者拼接组合;
采用神经网络作为特征交互方法能够自动组合高阶特征关系,输入为最终的特征交互向量P,输出预测的评分,如下所示:
ypred=Relu(W*(Relu(…(P)…))+B);
4)通过目标任务即显示数据的评分预测任务,设计平方损失函数作为优化目标:
Loss=(ypred-yreal)2+λ*||Para||2
其中,ypred是方法预测的评分,yreal是用户对商品真实的评分,Para是神经网络中可训练的参数,上式第一部分是真实值与预测值的平方差,第二部分是L2正则化,λ系数用于控制正则化强度以防止过拟合;
(4)、通过实验结果比较获取注意力神经网络方法,将通过该方法组合得到的特征表示向量输入多层感知机方法中获得用户对商品的评分预测:
1)设计5种变体方法,分别是不使用注意力机制的方法,只使用局部注意力网络的方法,只使用全局注意力网络的方法,在将局部的交互特征表示和全局的交互特征表示组合时采取相加操作的方法及采取将二者拼接组合的方法;
2)对以上5种变体方法进行了对比试验;通过方法变体对比试验的结果,选择出最优的方法作为最终的预测方法;
(5)基于用户对商品的评分预测,给用户推荐评分预测最高的商品,并基于注意力网络中的注意力系数给出推荐理由:
1)确定最优的注意力神经网络方法,使用该方法进行预测,得到用户对商品的预测评分,将预测评分高的物品推荐给该用户;
2)获得全局注意力网络的注意力系数并可视化;
3)依据得到的注意力系数,基于系数最大的元路径生成解释作为给用户推荐该商品的理由。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011276253.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数字孪生平台的模块化建筑物健康监测系统
- 下一篇:一种电饭煲金属外壳