[发明专利]融合标签和注意力机制的跨领域推荐方法及其实现系统有效

申请号：	202010068923.6	申请日：	2020-01-21
公开（公告）号：	CN111291261B	公开（公告）日：	2023-05-26
发明（设计）人：	钱忠胜;涂宇;朱懿敏	申请（专利权）人：	江西财经大学
主分类号：	G06F16/9535	分类号：	G06F16/9535;G06N3/045;G06N3/0442;G06N3/048;G06N3/0499;G06N3/084
代理公司：	深圳市华腾知识产权代理有限公司 44370	代理人：	彭年才
地址：	330000 江西省南***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	融合标签注意力机制领域推荐方法及其实现系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种融合标签和注意力机制的跨领域推荐方法，其特征在于，包括以下步骤：

步骤一，选择和构建跨领域融合的标签，将两个相近领域融合为一个新领域，作为跨领域推荐的源领域，对源领域和目标领域的标签向量分别进行加权求和，得到每个资源的资源向量；

步骤二，依据基于注意力机制的兴趣挖掘算法，通过长短期记忆算法LSTM学习用户和资源之间的时序关系，并引入注意力机制，得到用户在源领域和目标领域的指定时间段内的偏好；

步骤三，依据基于BP神经网络的跨领域标签映射算法，通过三层BP神经网络来学习源领域与目标领域间的标签映射，将用户源领域的偏好向量映射到目标领域后，并与用户在目标领域的偏好向量加权求和，得到用户在目标领域的综合偏好；

步骤四，融合标签映射和注意力机制的跨领域推荐算法，根据用户在源领域和目标领域中的综合偏好，计算在目标领域中，用户未浏览过的资源向量与用户的综合偏好的相似度，将前N项推荐给用户；

其中，步骤一中的所述选择和构建跨领域融合的标签流程包括：

步骤1-1，源领域和目标领域的数据预处理：

采集两个相近的领域A和领域B、及目标领域C中的普遍使用的标签作为定制标签DT，检索与所述定制标签相关的资源，得到与所述资源对应的资源标签RT，去除重复的标签后，得到RT-DT矩阵，矩阵的每一列为定制标签DT向量，每一行为资源标签RT向量，对剩余的定制标签向量进行统一度量；

步骤1-2，跨领域融合标签的选择与构建；

分析A、B领域相同的定制标签DT向量以及相同的资源标签RT向量的相似度，利用余弦相似度计算用户A与B资源内同一DT向量以及同一RT向量的相似度，如式(1)所示：

其中，和分别表示A领域和B领域的同一DT或RT，、分别为标签和的向量表示；为了确保推荐质量，将相似度低于阈值的标签剔除；

在已构建标签向量的各领域中，对定制标签DT和资源标签RT进行筛选，依据用户在各领域上的兴趣对相同资源标签RT向量进行加权求和，得到A-B领域标签向量矩阵，如式(2)和式(3)所示：

其中，为跨领域融合标签，为标签的向量表示；

各个资源的资源标签RT按照该标签被用户标注的次数排序，前面的标签比后面的标签与资源的联系更为密切，按式(4)为每个资源的标签分配权重：

对A-B领域和C领域分别使用式(4)得到所有资源的每个标签向量对应的权重，再将这些标签向量加权求和得到每个资源的资源向量，如式(5)所示：

其中，为资源的每个标签的标签向量，为资源的资源向量；

步骤二中的所述基于注意力机制的兴趣挖掘算法，包括如下步骤：

使用长短期记忆算法学习用户和资源之间的时序关系，假设记忆单元层的更新间隔为时间步，是记忆单元层在时间的输入；与是权重矩阵；是偏差向量；具体为:

步骤2-1，在每一个时间步，将输入门输入信息与权值相乘，再加上偏置量，计算得到输入门的控制变量和新的输入向量，具体如式(6)和式(7)所示：

步骤2-2，在每一个时间步，计算遗忘门的控制变量与候选状态相乘，即将遗忘门输入信息与权值相乘，再加上输入门输入信息与权值的乘积，然后将记忆单元状态从更新到，具体如式(8)和式(9)所示：

步骤2-3，在更新后的记忆单元状态中，不断计算输出门的值，具体如式(10)和式(11)所示：

步骤2-4，计算损失函数，并使用梯度下降法将其最小化，如式(12)所示：

经过长短期记忆算法LSTM层计算后，将LSTM每个时间步隐藏状态作为输出结果输出到注意力层，以捕获序列之间的依赖关系，加权求和后得到输出序列i对应的上下文向量表示，具体公式描述如式(13)和式(14)所示：

其中，为LSTM第i个时间步的输出，表示第i个时间步与第j个时间步的输出进行归一化后的权重，相似度计算函数采用W表示的矩阵变换；

步骤三中的所述基于BP神经网络的跨领域标签映射算法，包括如下流程：

通过三层BP神经网络来学习不同领域间的标签映射，首先在A-B领域和C领域分别收集用户使用最多的n个标签，根据式(4)分别计算两个领域中每个标签的权重，再通过加权分别计算该用户在A-B和C领域的特征向量，具体如式(15)和式(16)所示：

其中，为用户在A-B领域的特征向量，和为A-B领域各标签的权重和该标签的特征向量；为用户在C领域的特征向量，和为C领域各标签的权重和该标签的特征向量；

然后，以为输入向量，为实际输出向量，使用BP神经网络学习和之间的映射，如式(17)~(21)所示：

输入层到隐藏层的映射关系如式(17)所示：

经过隐藏层的激活函数如式(18)所示：

隐藏层到输出层的映射关系如式(19)所示：

经过输出层的激活函数如式(20)所示：

BP神经网络的损失函数如式(21)所示：

其中，在式(14)和式(16)中，；n为BP神经网络的隐藏层单元的数量，即，，其中，为输入层单元数量，为输出层单元数量；

步骤四中的所述融合标签映射和注意力机制的跨领域推荐算法，具体包括如下步骤：

步骤4-1，设A-B领域的历史记录经过LSTM层和注意力层处理后的用户偏好向量为，C领域的历史记录经过LSTM网络处理后的用户偏好向量为，源领域和目标领域之间的映射网络为，按式(22)将和加权求和，得到最终的用户资源向量：

其中，表示用户的资源向量，表示用户历史记录中目标领域资源的数量，表示用户历史记录中源领域资源的数量；

步骤4-2，在计算得到最终的用户资源向量后，计算用户资源向量和资源库中目标领域的资源向量的相似度，具体如式(23)所示：

其中，表示用户资源向量，表示资源库中目标领域的资源向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江西财经大学，未经江西财经大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010068923.6/1.html，转载请声明来源钻瓜专利网。

上一篇：数据采集方法、装置和电子设备
下一篇：应用的分摊显示方法、终端、可穿戴设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]融合标签和注意力机制的跨领域推荐方法及其实现系统有效

专利文献下载