[发明专利]融合标签和注意力机制的跨领域推荐方法及其实现系统有效

专利信息
申请号: 202010068923.6 申请日: 2020-01-21
公开(公告)号: CN111291261B 公开(公告)日: 2023-05-26
发明(设计)人: 钱忠胜;涂宇;朱懿敏 申请(专利权)人: 江西财经大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06N3/045;G06N3/0442;G06N3/048;G06N3/0499;G06N3/084
代理公司: 深圳市华腾知识产权代理有限公司 44370 代理人: 彭年才
地址: 330000 江西省南*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 融合 标签 注意力 机制 领域 推荐 方法 及其 实现 系统
【权利要求书】:

1.一种融合标签和注意力机制的跨领域推荐方法,其特征在于,包括以下步骤:

步骤一,选择和构建跨领域融合的标签,将两个相近领域融合为一个新领域,作为跨领域推荐的源领域,对源领域和目标领域的标签向量分别进行加权求和,得到每个资源的资源向量;

步骤二,依据基于注意力机制的兴趣挖掘算法,通过长短期记忆算法LSTM学习用户和资源之间的时序关系,并引入注意力机制,得到用户在源领域和目标领域的指定时间段内的偏好;

步骤三,依据基于BP神经网络的跨领域标签映射算法,通过三层BP神经网络来学习源领域与目标领域间的标签映射,将用户源领域的偏好向量映射到目标领域后,并与用户在目标领域的偏好向量加权求和,得到用户在目标领域的综合偏好;

步骤四,融合标签映射和注意力机制的跨领域推荐算法,根据用户在源领域和目标领域中的综合偏好,计算在目标领域中,用户未浏览过的资源向量与用户的综合偏好的相似度,将前N项推荐给用户;

其中,步骤一中的所述选择和构建跨领域融合的标签流程包括:

步骤1-1,源领域和目标领域的数据预处理:

采集两个相近的领域A和领域B、及目标领域C中的普遍使用的标签作为定制标签DT,检索与所述定制标签相关的资源,得到与所述资源对应的资源标签RT,去除重复的标签后,得到RT-DT矩阵,矩阵的每一列为定制标签DT向量,每一行为资源标签RT向量,对剩余的定制标签向量进行统一度量;

步骤1-2,跨领域融合标签的选择与构建;

分析A、B领域相同的定制标签DT向量以及相同的资源标签RT向量的相似度,利用余弦相似度计算用户A与B资源内同一DT向量以及同一RT向量的相似度,如式(1)所示:

其中,和分别表示A领域和B领域的同一DT或RT,、分别为标签和的向量表示;为了确保推荐质量,将相似度低于阈值的标签剔除;

在已构建标签向量的各领域中,对定制标签DT和资源标签RT进行筛选,依据用户在各领域上的兴趣对相同资源标签RT向量进行加权求和,得到A-B领域标签向量矩阵,如式(2)和式(3)所示:

其中,为跨领域融合标签,为标签的向量表示;

各个资源的资源标签RT按照该标签被用户标注的次数排序,前面的标签比后面的标签与资源的联系更为密切,按式(4)为每个资源的标签分配权重:

对A-B领域和C领域分别使用式(4)得到所有资源的每个标签向量对应的权重,再将这些标签向量加权求和得到每个资源的资源向量,如式(5)所示:

其中,为资源的每个标签的标签向量,为资源的资源向量;

步骤二中的所述基于注意力机制的兴趣挖掘算法,包括如下步骤:

使用长短期记忆算法学习用户和资源之间的时序关系,假设记忆单元层的更新间隔为时间步,是记忆单元层在时间的输入;与是权重矩阵;是偏差向量;具体为:

步骤2-1,在每一个时间步,将输入门输入信息与权值相乘,再加上偏置量,计算得到输入门的控制变量和新的输入向量,具体如式(6)和式(7)所示:

步骤2-2,在每一个时间步,计算遗忘门的控制变量与候选状态相乘,即将遗忘门输入信息与权值相乘,再加上输入门输入信息与权值的乘积,然后将记忆单元状态从更新到,具体如式(8)和式(9)所示:

步骤2-3,在更新后的记忆单元状态中,不断计算输出门的值,具体如式(10)和式(11)所示:

步骤2-4,计算损失函数,并使用梯度下降法将其最小化,如式(12)所示:

经过长短期记忆算法LSTM层计算后,将LSTM每个时间步隐藏状态作为输出结果输出到注意力层,以捕获序列之间的依赖关系,加权求和后得到输出序列i对应的上下文向量表示,具体公式描述如式(13)和式(14)所示:

其中,为LSTM第i个时间步的输出,表示第i个时间步与第j个时间步的输出进行归一化后的权重,相似度计算函数采用W表示的矩阵变换;

步骤三中的所述基于BP神经网络的跨领域标签映射算法,包括如下流程:

通过三层BP神经网络来学习不同领域间的标签映射,首先在A-B领域和C领域分别收集用户使用最多的n个标签,根据式(4)分别计算两个领域中每个标签的权重,再通过加权分别计算该用户在A-B和C领域的特征向量,具体如式(15)和式(16)所示:

其中,为用户在A-B领域的特征向量,和为A-B领域各标签的权重和该标签的特征向量;为用户在C领域的特征向量,和为C领域各标签的权重和该标签的特征向量;

然后,以为输入向量,为实际输出向量,使用BP神经网络学习和之间的映射,如式(17)~(21)所示:

输入层到隐藏层的映射关系如式(17)所示:

经过隐藏层的激活函数如式(18)所示:

隐藏层到输出层的映射关系如式(19)所示:

经过输出层的激活函数如式(20)所示:

BP神经网络的损失函数如式(21)所示:

其中,在式(14)和式(16)中,;n为BP神经网络的隐藏层单元的数量,即,,其中,为输入层单元数量,为输出层单元数量;

步骤四中的所述融合标签映射和注意力机制的跨领域推荐算法,具体包括如下步骤:

步骤4-1,设A-B领域的历史记录经过LSTM层和注意力层处理后的用户偏好向量为,C领域的历史记录经过LSTM网络处理后的用户偏好向量为,源领域和目标领域之间的映射网络为,按式(22)将和加权求和,得到最终的用户资源向量:

其中,表示用户的资源向量,表示用户历史记录中目标领域资源的数量,表示用户历史记录中源领域资源的数量;

步骤4-2,在计算得到最终的用户资源向量后,计算用户资源向量和资源库中目标领域的资源向量的相似度,具体如式(23)所示:

其中,表示用户资源向量,表示资源库中目标领域的资源向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西财经大学,未经江西财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010068923.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top