[发明专利]一种联合主题模型和异质信息网络的评分预测方法有效
申请号: | 201910620143.5 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110570226B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 汤景凡;张秀杰;张旻;姜明;黄涛;吴鑫强 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联合 主题 模型 信息网络 评分 预测 方法 | ||
1.一种联合主题模型和异质信息网络的评分预测方法,其特征在于包含如下步骤:
步骤(1)针对指定用户商品对,利用主题模型提取评论信息,从而构建用户和商品的向量表示;
步骤(2)利用商品属性信息和用户共同购买信息构建异质信息网络;
步骤(3)从异质网络中提取出用户商品对的最终关系表示向量;
步骤(4)针对用户商品对,连接用户向量、关系表示向量、商品向量表示,并输入到AFM实现评分预测;
步骤(5)根据模型计算出的预测评分数据和真实评分数据,计算RMSE值,并把此值作为模型效果的评价指标;
步骤(1)具体实现如下:
1-1.首先通过双向lstm获取评论中某个单词的上下文向量表示;假设用户表示为一个K维的潜在因子向量,其中的每一维表示用户对相关主题喜爱程度;即K表示主题的个数;
1-2.为每一个主题设置一个上下文主题向量vk∈Rdim,对于用户的第i条评论,表示为(wi,1,wi,2,wi,3…,wi,T),其中T表示单词的个数,wi,T表示单词对应的上下文表示向量:
首先通过一层的MLP获取单词wi,t在第k个主题下的隐藏表示
其次将单词表示向量和第k个主题的相似度,作为此单词对这个主题的重要权重,并且通过softmax函数获取标准重要权重
接着通过每个单词向量的加权求和来表示此条评论在这个主题上的表示
最终通过一层MLP把此条评论向量映射为一个对主题相关度的值ci,k;
最终第i条评论,映射到每一个主题之后的最终表示为ci=[ci,1,ci,2,...,ci,K];其中ci,k表示第i条评论对第k个主题相关程度值;表示隐藏参数矩阵,它把单词向量hi,t转换为主题k下的隐藏向量表示,表示可训练的偏差向量,表示此单词对主题k的重要程度;表示映射矩阵,它把评论在主题k的表示映射为对相应主题的反映程度值;表示偏差系数;
1-3.首先针对每个用户获取U∈RLu×K,其中Lu表示用户评论的个数,K表示主题的个数,也是用户表示向量的维度;U=[c1,c2,...,cLu],其中ci∈RK表示用户第i条评论的表示向量,同理针对每个商品我们用V∈RLv×K,其中Lv表示商品评论的条数;通过直接相乘获得关联矩阵的结果,然后对每行元素的最大池化来获取此条评论的重要程度,接着通过一个softmax层获取标准化的重要程度值,最后通过用户矩阵中行向量的线性加权来获取最终的用户表示;
wr=UMVT (5)
其中M∈RK×K,表示可训练的中间矩阵;Wr∈RLu×Lv,表示最终获得的关联矩阵;
接着通过最大行池化来计算每条评论的重要程度,并最终获得用户的一个向量表示:
au=SoftMax(Maxrow(Wr)) (6)
au∈RLu×1向量的每一维表示对应评论的重要程度权重值,表示最终的用户向量表示,上面的公式(7)中,只对用户每条评论重要程度进行选择,并没有针对物品,主要是因为在现实世界中,商品的特点相对稳定;
步骤(2)具体实现如下:
利用商品属性信息和用户共同购买信息构建异质信息网络,根据三种元路径构建异质信息网络,三种元路径分别为UBUB、UBCatB和UBBrdB,其中UBUB表示用户共同购买信息;UBCatB表示和用户以前购买商品的类别相同的商品;UBBrdB表示和用户以前购买商品的品牌相同的商品;
步骤(3)具体实现如下:
3-1.首先通过metapath2vec++获取所有节点的初始向量表示,提取信息的时候采用CNN卷积每种类型元路径的所有实例数据:
其中,hu,i,p,s∈Rl1表示对于指定的用户和商品对,元路径类型为p的某个具体路径s卷积后的向量表示;fu→i,p∈Rl1表示对于指定的用户商品对,元路径类型为p的关联向量表示;
3-2.通过注意力机制实现不同路径信息的融合:
用fu→i表示对于指定用户商品对,融合所有类型的元路径实例之后的向量表示,Pu→i表示用户u到商品i的三种元路径类型集合,由于最终要进行评分预测,把从评论中提取的信息也关联到Attention中,设计一个两层的结构来实现Attention:
au,i,p=relu(W2αu,i,p+b) (11)
其中[]表示的是连接操作,表示主题模型中提取出的用户向量表示,表示主题模型中提取出的商品向量表示,W1∈Rl3×(l1+2×K),bv∈Rl3,W2∈R1×l3都表示可训练的参数矩阵;
接着通过softmax层标准化权重大小,然后通过线性加权获得用户商品对的表示向量:
其中fu→i,p表示用户u和商品i,在元路径类型为p下的关联向量,au,i,p表示对用关联向量的权重系数;
步骤(4)具体实现如下:
针对用户商品对,连接用户向量、关系表示向量、商品对的表示向量,并输入到AFM实现评分预测;把三个向量直接连接组成最终AFM输入X,其中
其中,表示评论信息中提取的用户表示向量,表示商品所受到的所有评论中提取出的商品表示向量,fu→i表示商品属性信息和用户共同购买信息中提取出的表示向量;⊙表示向量之间的乘积,{v1,v2…,vn}表示因子参数向量,用来表示任意二维特征xi和xj的交互;aij表示特征xi和xj交互之后的二维特征的权重系数;wi表示一维特征xi的重要程度系数;w0是全局偏差系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910620143.5/1.html,转载请声明来源钻瓜专利网。