[发明专利]一种基于读者偏好的个性化数字图书推荐系统、方法、计算机及存储介质有效
申请号: | 202110919211.5 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113590970B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王代琳;刘丽娜;吕云蕾;刘勋;赵月;刘亚秋 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06Q50/26;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市伟晨专利代理事务所(普通合伙) 23209 | 代理人: | 荣玲 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 读者 偏好 个性化 数字 图书 推荐 系统 方法 计算机 存储 介质 | ||
1.一种基于读者偏好的个性化数字图书推荐方法,是依托一种基于读者偏好的个性化数字图书推荐系统实现的,包括数据输入模块、编码器模块、语义融合模块、解码器模块和预测评分模块;
所述数据输入模块用于将图书文本转化为低维词嵌入向量;
所述编码器模块包括图书语义编码模块和兴趣度量模块;
所属图书语义编码模块用于将低维词嵌入向量转化为具有图书语义的特征向量;
所述兴趣度量模块用于根据读者历史浏览直接行为和间接行为,计算读者兴趣度Id;
所述语义融合模块用于将图书语义特征向量和读者兴趣度Id融合生成读者偏好向量;
所述解码器模块用于计算候选图书语义特征向量和读者偏好向量的相似度量;
所述预测评分模块用于输出图书的推荐结果;其特征在于,包括以下步骤:
S1对输入的数据进行预处理,将图书文本转化为低维词嵌入向量;
S2将低维词嵌入向量转化为具有图书语义的特征向量,具体是,
A将低维词嵌入向量转经过BiLSTM模型输出隐态向量;
将图书低维词嵌入向量作为BiLSTM模型的输入,经每个时间步长t都会生成一个隐态向量Ht输出;
BiLSTM模型在t时刻的隐藏状态,包含前向的和后向的具体计算如下:
其中,ht-1为t-1时刻隐层的输出,xt为当前时刻即t时刻的输入,Ct-1为t-1时刻细胞状态,为t时刻LSTM的前向输出,为t时刻LSTM的后向输出,Ht为t时刻前向和后向两个方向的结合;
B经过注意力机制输出图书语义特征向量;
BiLSTM模型的输出为H=[h1,h2,...,hn],经由注意力机制的两层Attention编码,H经第一层Self-Attention;
a)计算sti
其中,相似度函数选取缩放点积模型,为缩放比例因子,dk为词向量的维度,qt为查询、ki为键,hi和hj分别为第i个词向量和第j个词向量,sti为相关系数表示序列内部第i个词和第j个词之间的关联程度;
b)计算αti
其中,softmax为激活函数,将值映射到[0,1]区间内,αti为第i个注意力权重系数;
c)计算ui
其中,αti为第i个注意力权重系数,hi为第i个词向量,ui为第i个向量的第一层Self-Attention输出;
d)第一层Self-Attention提取到的图书特征向量p={u1,u2,...un}作为第二层序列间注意力层的输入,各个图书序列间的注意力权重为:
s(pt,pj)=vTtanh(Ypt+Upj)
其中,相似度函数选取加性模型,模型中v、Y、U是可训练的参数,v∈Rd,W∈Rd×d,U∈Rd×d,pt和pj分别为第t个和第j个序列,αj为第j个序列注意力权重;将各个序列下的注意力融合,最终得到的第j个图书语义特征向量表示为:
其中,αj为第j个序列的注意力权重,pj为第j个序列,cj为第二层Attention输出的第j个图书语义特征向量;
S3根据读者历史浏览直接行为和间接行为,计算读者兴趣度Id;
S4将图书语义特征向量与读者兴趣度相融合生成读者偏好向量;
S5计算候选图书语义特征向量与读者偏好向量之间的相似度量;
S6将相似度量计算结果输入到预测评分模块得到预测评分,输出候选图书的Top-N作为推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110919211.5/1.html,转载请声明来源钻瓜专利网。