[发明专利]一种商品信息推荐方法、系统和存储介质有效
申请号: | 202110590095.7 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113222711B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 蔡晓东;刘家良 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N3/04;G06N3/08 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 尉保芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商品信息 推荐 方法 系统 存储 介质 | ||
1.一种商品信息推荐方法,其特征在于,包括如下步骤:
S1:导入原始数据集,将所述原始数据集处理成知识图谱,通过知识图谱形式得到知识图谱数据集,并将所述知识图谱数据集划分为训练集和测试集;
S2:根据强化学习方法构建探索策略;
S3:基于图神经网络对所述知识图谱和所述探索策略构建策略网络定义目标商品,并计算目标商品的奖励函数和损失函数;
S4:通过损失函数和奖励函数分别计算出所述知识图谱数据集中各个数据的总损失值和累计奖励,再通过反向传播算法对所有数据的总损失值和累计奖励进行反向传播,得到商品推荐模型,并通过所述训练集对所述商品推荐模型进行训练;
S5:将所述测试集输入经训练后的商品推荐模型中,通过经训练后的商品推荐模型得到商品推荐结果;
所述步骤S1的过程包括:
S1.1:定义原始数据集O={(u,i)|u∈U,i∈I},其中,U为用户集,I为商品集,(u,i)为用户u与商品i存在互动;
S1.2:定义知识图谱G={e,r}|,e为节点,r为节点间关系,其中{u,i}∈e,所述知识图谱包括用户集和商品集,将所述知识图谱以所述互动(u,i)为起点,寻找到中间节点e′,所述中间节点e′与节点i和节点j相连,所述中间节点e′为用户u选择节点i所对应商品的判断因素以及适合用户u的节点j所对应商品的判断因素;
所述步骤S2的过程具体包括:
S2.1:基于马尔可夫决策过程定义寻找目标节点的采样过程,所述采样过程的过程包括:所述目标节点为M={S,A,P,R};其中,A={a},A为探索动作a的集合,S={s},S为状态s的集合,P为状态s的转移函数,R为奖励函数,采样器为fS(),参数为θS;
S2.2:定义探索过程,所述定义探索过程的过程包括:在任一探索步骤t中,定义采样的动作at=(et→et′→et+1),ɑt为两跳的路径,所述ɑt包括(et,et′)和(et′,et+1)两跳路径,所述路径在T次探索后,通过所述采样器生成2T跳的路径;定义探索策略π=(e1,e2…eT),eT为所述采样器最终选择的目标节点,并将所述目标节点eT作为目标商品推荐给用户;
S2.3:定义探索状态,所述定义探索状态的过程包括:在任一探索步骤t中,所述采样器当前访问节点et,定义状态st=(u,et),探索步骤t为(s0,a1,s1…at,st),初始化状态s0=(u,i)为以所述互动(u,i)为起点开始探索的状态;
S2.4:定义探索动作,所述定义探索动作的过程包括:在任一探索步骤t中,所述节点et所有的探索动作at构成动作空间At;
S2.5:定义转移函数,所述定义转移函数的过程包括:在任一探索步骤t中,动作at由状态st转移到下一个状态时需要的转移函数为:
P(st+1=(u,et+1)|st=(u,et),at=(et→et′→et+1))=1,
从而构建得到探索策略;
所述步骤S3的过程包括:
S3.1:根据图神经网络中的GraphSage算法,在所述知识图谱G和用户商品图O+上生成节点的嵌入表示,在第l个图卷积层,节点e表示为节点e的邻居节点集合Ne表示为节点e聚合所述节点e邻居节点集Ne的信息并更新表示,其中,
其中,
其中,为所述节点e经过l次传播后的表示,所述为所述节点e经过第l-1次传播后的表示,W(l)为权重矩阵,||为连接操作,ρ为LeakyReLU激活函数,为所述节点e经过第l-1次传播后的邻居集合表示;
每个零节点信息表示为经过L次传播后的节点表示为并将经过L次传播后的节点表示嵌入到知识表示中;
S3.2:经过所述GraphSage算法的节点表示为:
经过GCN的节点表示为:
S3.3:构建基于GraphSage算法的GCN策略网络,所述构建基于GraphSage算法的GCN策略网络包括:
通过GCN网络生成的节点表示为hGCN,经过GraphSage生成节点表示为hGraphSage,并经过dropout生成最终的节点表示hout;其公式为:
hout=dropout(hGraphSage),
其中,hGraphSage=GraphSage(hGCN),
或构建基于GCN的GraphSage策略网络,所述构建基于GCN的GraphSage策略网络的过程包括:
将所述知识图谱数据集分别经过GraphSage算法和GCN生成的节点分别表示为所述hGraphSage和所述hGCN,并将两者相加后并通过GCN层生成表示h′GCN,并经过dropout生成最终的节点表示hout;其公式为:
hout=dropout(h′GCN),
其中,h′GCN=GCN(hGraphSage+hGCN);
S3.4:定义探索步骤,所述定义探索步骤的过程包括:
在所述状态st=(u,et)中,所述动作at=(et→et′→et+1)包括两个环节,第一环节为(et,et′),第二环节为(et′,et+1),所述动作at=(et→et′→et+1)满足
P(at,st)=P((et,et′)|st)·P((et′,et+1)|st,(et,et′)),
其中,P(at,st)为目标节点et+1的概率,
经过所述第一环节和所述第二环节的节点选择,最终得到目标节点;
S3.5:计算知识图谱节点的邻居节点注意力,所述计算知识图谱节点的邻居节点注意力的过程包括:
所述节点et的邻居节点et′重要性表示为:P(et,et′)为et′能获得注意力大小或选择概率;
利用softmax函数进行归一化处理:
所述节点et的某个所述邻居节点et′在所有邻居节点et″中能获得的注意力为:
S3.6:计算商品的邻居节点注意力,所述计算商品的邻居节点注意力的过程包括;
从所述节点et′邻居中选出目标节点et+1;选择所述目标节点et+1的概率为所述目标节点et+1在所述节点et′所有邻居e″t+1中被选中的概率为
经过两次注意力的计算选出概率为P(at,st)的节点,将概率最高的目标节点et+1作为所述目标商品j推荐给所述用户u;
S3.7:邻居节点简化,所述邻居节点简化的过程包括:
所述节点e的邻居节点集Ne中随机采样n1个节点构成集合使用评分函数匹配e和e′的相似度,选出排名靠前的n2个节点构成集合用所述集合代替所述邻居节点集Ne,其中,n2n1;
S3.8:计算所述目标商品j的奖励函数,所述计算所述目标商品的奖励函数的过程包括:
R(j)=gate*fu(u,j)+(1-gate)*fi(i,j),
其中,fu(u,j)=ruTrj为所述用户u和所述节点j的匹配程度,fi(i,j)=riTrj为所述节点j和所述商品i的相似度,gate=sigmoid(Wfi(i,j))为分配预测奖励与相似度奖励所占比重;
S3.9计算目标商品j的损失函数,所述计算目标商品j的损失函数的过程包括:
计算所述目标商品j的损失值为:
其中,为L2正则化项,σ为sigmoid函数;ru为用户信息,ri为历史商品信息,rj为推荐商品信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110590095.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于像素曲率的三维模型自适应切片方法
- 下一篇:一种节能环保水泵