[发明专利]一种基于对齐损失的跨领域推荐冷启动方法在审
申请号: | 202211320186.X | 申请日: | 2022-10-26 |
公开(公告)号: | CN115600001A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 庄福振;王飞;徐勇军 | 申请(专利权)人: | 中科(厦门)数据智能研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536 |
代理公司: | 安徽善安知识产权代理事务所(特殊普通合伙) 34200 | 代理人: | 刘勇 |
地址: | 361021 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对齐 损失 领域 推荐 冷启动 方法 | ||
1.一种基于对齐损失的跨领域推荐冷启动方法,其特征在于,包括如下步骤:
A1、建立推荐问题的数学模型:创建源域和目标域数据集,并将源域记为S,目标域记为T,源域和目标域均创建项目集V、用户集U以及评价矩阵T,将rij记为评价矩阵中用户ui对项目vj的评分,源域的项目集、用户集和评价矩阵记为VT、UT和RT,目标域的项目集、用户集合评价矩阵记为VS、US和RS,在UT和US存在重叠用户,并将重叠用户集记为Uo,而在冷启动问题中所设置的目标用户是不属于源域用户集UT且属于目标域用户集US的用户;
A2、建立单域潜在因子模型:在源域中,将用户的嵌入和项目的嵌入分别记为和其中d记为嵌入的长度,建立评价矩阵中rij的概率模型;
A3、计算模型的最小损失函数:利用极大似然法对rij进行评估,求解最小损失,并利用这种估计方法对源域和目标域分别训练出相互独立的概率模型;
A4、利用训练完成的用户嵌入函数将用户从源域嵌入到目标域,创建编码-解码框架,联合重叠数据和非重叠数据,构建低维损失训练模型:将源域连接第一层自动编码器,将目标域连接第二层自动编码器,第一层自动编码器和第二层自动编码器分别连接有第一层自动解码器和第二层自动解码器,利用第一层自动编码器、第二层自动编码器、第一层自动解码器和第二层自动解码器构建完全连接的网络,利用第一层编码器和第二层编码器提取源域和目标域中的不变因素,计算重叠用户的低维对齐损失;
A5、用目标域中的第二解码器将不变因子映射到目标域特定的项目中进行推荐。
2.如权利要求1所述的一种基于对齐损失的跨领域推荐冷启动方法,其特征在于,A2中,rij的概率模型如下:
式中:P(rij|Ui,Vj;σ2)记为评分rij的概率,记为矩阵Ui和Vj的内积,σ记为方差,其中rij满足均值为方差为σ2的高斯分布,记为rij满足的高斯分布函数,使用的单域潜在因子推荐模型为基于深度学习的模型,作为全连接网络转换参数,所述全连接网络参数为第一层自动编码器和第二层自动解码器之间的转换参数。
3.如权利要求2所述的一种基于对齐损失的跨领域推荐冷启动方法,其特征在于,等于最小损失函数的极小值,所述最小损失函数的公式为:
式中:记为最小损失值,记为评价矩阵中用户ui对项目vj评分集合的长度对最小损失函数值的影响值,记为用户ui对项目vj评分的真实概率,记为评价矩阵中用户ui对项目vj评分真实概率和最大似然估计概率差的平方和。
4.如权利要求1所述的一种基于对齐损失的跨领域推荐冷启动方法,其特征在于,A4中用于训练嵌入映射函数的损失函数公式为:
式中:g记为嵌入映射函数,记为变量为θ时,源域中重叠用户对应的映射函数值与目标域中对应的重叠用户值的差值构成矩阵的L-2范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科(厦门)数据智能研究院,未经中科(厦门)数据智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211320186.X/1.html,转载请声明来源钻瓜专利网。