[发明专利]融合标签和注意力机制的跨领域推荐方法及其实现系统有效
申请号: | 202010068923.6 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111291261B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 钱忠胜;涂宇;朱懿敏 | 申请(专利权)人: | 江西财经大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/045;G06N3/0442;G06N3/048;G06N3/0499;G06N3/084 |
代理公司: | 深圳市华腾知识产权代理有限公司 44370 | 代理人: | 彭年才 |
地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 标签 注意力 机制 领域 推荐 方法 及其 实现 系统 | ||
1.一种融合标签和注意力机制的跨领域推荐方法,其特征在于,包括以下步骤:
步骤一,选择和构建跨领域融合的标签,将两个相近领域融合为一个新领域,作为跨领域推荐的源领域,对源领域和目标领域的标签向量分别进行加权求和,得到每个资源的资源向量;
步骤二,依据基于注意力机制的兴趣挖掘算法,通过长短期记忆算法LSTM学习用户和资源之间的时序关系,并引入注意力机制,得到用户在源领域和目标领域的指定时间段内的偏好;
步骤三,依据基于BP神经网络的跨领域标签映射算法,通过三层BP神经网络来学习源领域与目标领域间的标签映射,将用户源领域的偏好向量映射到目标领域后,并与用户在目标领域的偏好向量加权求和,得到用户在目标领域的综合偏好;
步骤四,融合标签映射和注意力机制的跨领域推荐算法,根据用户在源领域和目标领域中的综合偏好,计算在目标领域中,用户未浏览过的资源向量与用户的综合偏好的相似度,将前N项推荐给用户;
其中,步骤一中的所述选择和构建跨领域融合的标签流程包括:
步骤1-1,源领域和目标领域的数据预处理:
采集两个相近的领域A和领域B、及目标领域C中的普遍使用的标签作为定制标签DT,检索与所述定制标签相关的资源,得到与所述资源对应的资源标签RT,去除重复的标签后,得到RT-DT矩阵,矩阵的每一列为定制标签DT向量,每一行为资源标签RT向量,对剩余的定制标签向量进行统一度量;
步骤1-2,跨领域融合标签的选择与构建;
分析A、B领域相同的定制标签DT向量以及相同的资源标签RT向量的相似度,利用余弦相似度计算用户A与B资源内同一DT向量以及同一RT向量的相似度,如式(1)所示:
其中,和分别表示A领域和B领域的同一DT或RT,、分别为标签和的向量表示;为了确保推荐质量,将相似度低于阈值的标签剔除;
在已构建标签向量的各领域中,对定制标签DT和资源标签RT进行筛选,依据用户在各领域上的兴趣对相同资源标签RT向量进行加权求和,得到A-B领域标签向量矩阵,如式(2)和式(3)所示:
其中,为跨领域融合标签,为标签的向量表示;
各个资源的资源标签RT按照该标签被用户标注的次数排序,前面的标签比后面的标签与资源的联系更为密切,按式(4)为每个资源的标签分配权重:
对A-B领域和C领域分别使用式(4)得到所有资源的每个标签向量对应的权重,再将这些标签向量加权求和得到每个资源的资源向量,如式(5)所示:
其中,为资源的每个标签的标签向量,为资源的资源向量;
步骤二中的所述基于注意力机制的兴趣挖掘算法,包括如下步骤:
使用长短期记忆算法学习用户和资源之间的时序关系,假设记忆单元层的更新间隔为时间步,是记忆单元层在时间的输入;与是权重矩阵;是偏差向量;具体为:
步骤2-1,在每一个时间步,将输入门输入信息与权值相乘,再加上偏置量,计算得到输入门的控制变量和新的输入向量,具体如式(6)和式(7)所示:
步骤2-2,在每一个时间步,计算遗忘门的控制变量与候选状态相乘,即将遗忘门输入信息与权值相乘,再加上输入门输入信息与权值的乘积,然后将记忆单元状态从更新到,具体如式(8)和式(9)所示:
步骤2-3,在更新后的记忆单元状态中,不断计算输出门的值,具体如式(10)和式(11)所示:
步骤2-4,计算损失函数,并使用梯度下降法将其最小化,如式(12)所示:
经过长短期记忆算法LSTM层计算后,将LSTM每个时间步隐藏状态作为输出结果输出到注意力层,以捕获序列之间的依赖关系,加权求和后得到输出序列i对应的上下文向量表示,具体公式描述如式(13)和式(14)所示:
其中,为LSTM第
步骤三中的所述基于BP神经网络的跨领域标签映射算法,包括如下流程:
通过三层BP神经网络来学习不同领域间的标签映射,首先在A-B领域和C领域分别收集用户使用最多的n个标签,根据式(4)分别计算两个领域中每个标签的权重,再通过加权分别计算该用户在A-B和C领域的特征向量,具体如式(15)和式(16)所示:
其中,为用户在A-B领域的特征向量,和为A-B领域各标签的权重和该标签的特征向量;为用户在C领域的特征向量,和为C领域各标签的权重和该标签的特征向量;
然后,以为输入向量,为实际输出向量,使用BP神经网络学习和之间的映射,如式(17)~(21)所示:
输入层到隐藏层的映射关系如式(17)所示:
经过隐藏层的激活函数如式(18)所示:
隐藏层到输出层的映射关系如式(19)所示:
经过输出层的激活函数如式(20)所示:
BP神经网络的损失函数如式(21)所示:
其中,在式(14)和式(16)中,;
步骤四中的所述融合标签映射和注意力机制的跨领域推荐算法,具体包括如下步骤:
步骤4-1,设A-B领域的历史记录经过LSTM层和注意力层处理后的用户偏好向量为,C领域的历史记录经过LSTM网络处理后的用户偏好向量为,源领域和目标领域之间的映射网络为,按式(22)将和加权求和,得到最终的用户资源向量:
其中,表示用户的资源向量,表示用户历史记录中目标领域资源的数量,表示用户历史记录中源领域资源的数量;
步骤4-2,在计算得到最终的用户资源向量后,计算用户资源向量和资源库中目标领域的资源向量的相似度,具体如式(23)所示:
其中,表示用户资源向量,表示资源库中目标领域的资源向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西财经大学,未经江西财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010068923.6/1.html,转载请声明来源钻瓜专利网。