[发明专利]一种基于知识图谱嵌入的用户实体群组推荐方法在审
申请号: | 202110024581.2 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112732932A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李慧慧;张洁;夏军生;樊武;丁军峰;刘慷;刘伟;王刚;周帅锋 | 申请(专利权)人: | 西安烽火软件科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陆志斌 |
地址: | 710077 陕西省西安市长安区坤元*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 嵌入 用户 实体 推荐 方法 | ||
1.一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于,所述方法包括:
步骤一、根据三元组数据构建用户的知识图谱,用户的知识图谱包括当前用户的所有信息,由用户实体和关系组成;
步骤二、使用知识表示模型Ripple Net和预训练语言模型BERT分别将用户实体和关系进行向量化表示;
步骤三、使用基于内容的召回算法获取用户实体群组的候选集;
步骤四、使用基于attention的LSTM模型建模用户实体的时序特征;
步骤五、将嵌入向量输入到WideDeep模型中,获取用户实体间的高低阶交互,对用户实体进行画像;
步骤六、计算用户实体间的关联度,输出目标用户实体关联度top-K的用户实体群组。
2.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于:步骤五中,所述嵌入向量包括候选集中的用户实体时序特征或用户实体和关系的向量化表示。
3.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于:所述知识图谱,其形式化定义为:
知识图谱由形如(h,r,t)的三元组组成,其中h∈N,r∈R,t∈N分别表示头实体、关系或属性和尾实体,实体数量为P′,用户实体数量为P,关系数量为Q。
4.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于,步骤二中,所述将用户实体进行向量化表示具体包括:
设定知识图谱中,一共有P个用户节点,将其表示为用户节点集合
将知识图谱中的用户实体作为种子,对于每个种子,通过Ripple Net模型都产生种子的向量表示,对于用户节点它的k跳内用户实体集合表示为:
它的k跳三元组集合表示为:
使用词向量模型BERT初始化图谱中所有用户实体,表示为
通过Ripple NET模型用户实体向量,表示为
5.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于,步骤二中,所述将用户关系进行向量化表示具体包括:
使用词向量模型BERT初始化图谱中所有关系,表示为rj∈ER,j=1,2,...,Q。
6.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于:所述步骤三中,采用基于内容的召回算法产生用户实体候选集,所述基于内容的召回算法基于用户实体属性以及路径长度,通过候选集产生层获得用户候选集,其中用户实体表示
7.如权利要求1所述的一种基于知识图谱嵌入的用户实体群组推荐方法,其特征在于,所述步骤四具体包括:
将候选集用户实体表示向量以及关系表示向量ER作为LSTM的输入,LSTM的公式简化如下:
其中,h*表示LSTM每个单元的隐状态;
在注意力机制下输出向量是各个元素按其重要程度加权求和得到,如公式所示:
其中,参数i表示时刻,j表示序列中的第j个元素,Tx表示序列的长度,f(·)表示对元素每一维的编码;
aij看做是一个概率,反映了元素hj对Ci的重要性,使用softmax函数来表示,如公式所示:
其中,eij反映了带编码的元素和其他元素之间的匹配度,当匹配度越高时,说明该元素对其的影响越大,则aij的值也就越大;
通过基于attention的LSTM模型得到用户实体的特征嵌入向量表示fui∈Fu。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火软件科技有限公司,未经西安烽火软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110024581.2/1.html,转载请声明来源钻瓜专利网。