[发明专利]一种用户推荐方法有效
申请号: | 201711142196.8 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107943897B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 张邦佐;王美琪;武志远;孙小新;冯国忠 | 申请(专利权)人: | 东北师范大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08;G06Q30/02;G06Q30/06;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 130024 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 推荐 方法 | ||
1.一种用户推荐方法,其特征在于,具体包括以下步骤:
确定自编码器的输入数据x∈RN;
通过一个激活函数将输入数据映射到自编码器的隐含层;其中,隐含层表示为:
y=ρ(WTx+b);
其中y表示隐含层的结果,ρ表示激活函数,W表示N×H维的权重矩阵,WT表示权重矩阵W的转置矩阵,b∈RH表示偏置向量,x表示自编码器的输入向量;
将隐含层y映射到一个N维的重构的向量中,具体表示为:
其中W′=W,是tied权重,b′∈RN是偏置向量;
在数据集中训练模型参数,获得用户的预测评分;
所述训练模型参数通过最小化重构误差来进行,所述重构误差表示为:
其中,m表示用户数量,xi表示自编码器的输入数据,表示对应于输入数据的输出向量,l表示损失函数;
其中所述在数据集中训练模型参数包括以下步骤:
稀疏化自编码器的输入数据;
结合数据集的评分数据和显式信任信息进行训练;
其中,所述稀疏化自编码器的输入数据包括以下子步骤:
从数据集中的用户-项目评分矩阵中提取输入向量;
将输入向量中的缺失值置0;
在自编码器中加入masking噪声,其中损失函数表示为:
其中,a表示降噪平方误差的调整参数,(1-a)表示重构平方误差的调整参数,x'表示x∈RN中的破损部分,C(x')表示x'中破损的元素的集合,N(x)表示x中非破损元素的集合,表示神经网络第i次输出的结果,表示对x'的预测结果;
在反向传播之前,将输入向量中的缺失值的误差置0。
2.如权利要求1所述的用户推荐方法,其特征在于,所述结合数据集的评分数据和显式信任信息进行训练包括以下步骤:
将数据集中的显式信任信息和评分数据分别放入模型的输入层和隐含层中训练获得预测评分;
其中所述预测评分用降噪自编码器的输出层表示,具体表示如下:
其中,ti∈RT表示用户i的信任信息,xi表示自编码器的输入数据,VT∈RH×(N+T)和V′∈RH×N表示tied权重矩阵。
3.如权利要求1所述的用户推荐算法,其特征在于,所述在数据集中训练模型参数还包括通过相似度度量方法从数据集提取隐式信息;
并且结合数据集的评分数据、显式信任信息和所述隐式信息进行训练;
其中,损失函数表示为:
其中,Q(x)表示向量x中被加入噪声的那部分的维度元素的集合,Fro是弗罗贝尼乌斯范数,λ表示这一项的系数,是规则项,目的是为了规则化参数W。
4.如权利要求3所述的用户推荐方法,其特征在于,所述从数据集提取隐式信息包括以下步骤:
度量用户之间的隐式信任关系,表示为
其中,i,j表示用户i和用户j,n表示两个用户的共同评分的数量,pcc(i,j)表示用户之间的皮尔森相关系数,其表示为:
其中,ri,rj表示用户i和用户j的评分向量,k表示一个物品,ri,k,rj,k表示用户i和用户j的对物品k的评分,分别表示评分向量ri和rj的均值向量;
设置阈值θ,利用公式判定隐式信任关系,
其中,ti,j表示用户i和用户j的隐式的信任关系;
以及若ti,j=1,则提取隐式信任信息。
5.如权利要求1所述的用户推荐方法,其特征在于,所述激活函数为双曲正切函数。
6.如权利要求1所述的用户推荐方法,其特征在于,稀疏化输入数据的影响通过损失函数中的调整参数α来度量。
7.如权利要求1所述的用户推荐方法,其特征在于,所述稀疏化自编码器的输入数据的维度大于隐含层的维度,并且隐含层的维度大于附加信息的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北师范大学,未经东北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711142196.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:帐篷管材(2)
- 下一篇:一种数字多媒体资料管理系统、方法及扫描装置