[发明专利]基于难度采样元学习的地点推荐方法及装置有效
申请号: | 202011333364.3 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112417319B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 朱文武;王鑫;陈禹东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/29;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 难度 采样 学习 地点 推荐 方法 装置 | ||
1.一种基于难度采样元学习的地点推荐方法,其特征在于,包括以下步骤:
S1,根据不同城市的不同用户的交互数据生成训练数据和测试数据;
S2,构建推荐模型,利用所述训练数据和所述测试数据训练并优化所述推荐模型;
S3,利用元学习框架优化所述推荐模型的参数;
S4,通过所述推荐模型为用户进行城市推荐。
2.根据权利要求1所述的方法,其特征在于,所述训练数据和所述测试数据包括:
每个用户根据时间顺序产生多个样本{(xi,yi)},定义最小历史数据数目m,用户历史数据总数目为n,则每个用户产生n-m个正样本:
yi=1,
其中,u是用户编号,为用户u的历史数据,ri为用户u的备选地点;
利用均匀负采样,将正样本中的备选地点换成其他地点,构成负样本;
将每个用户产生的正样本和负样本中,按照时间顺序将较早的k个样本作为训练数据,其余的样本为测试数据。
3.根据权利要求1所述的方法,其特征在于,所述推荐模型包括:嵌入层、注意力层和全连接层;
所述嵌入层用于将历史数据中的每一个地点、以及备选地点ri,利用多个相同的嵌入矩阵映射成一个向量;
所述注意力层用于刻画备选地点与历史交互地点之间的关联,采用注意力机制,利用备选地点向量对每一个历史地点向量计算注意力分数并算加权和,得到所有历史地点的整体编码h:
h=attention(ecandi,ehist),
attention(K,V)=softmax(MLPatt([K;V;K-V;K·V]))V
其中,MLPatt是一个2层的多层感知机,其参数记为θatt,ecandi代表备选地点向量,而ehist=[e1,e2,...,en]是历史交互地点向量组成的列表,[;]表示向量拼接,·表示按位相乘;
所述全连接层将所述历史地点的整体编码h与备选地点的编码向量ecandi通过一个3层的全连接网络MLPrec,参数记为θrec,映射成二分类标签
所述推荐模型的可训练参数为θ={Ecate,Etime,θatt,θrec}。
4.根据权利要求3所述的方法,其特征在于,所述嵌入矩阵包括地点编号的矩阵Eid、地点类别的矩阵Ecate、交互时间的矩阵Etime,分别把地点编号、类别的独热向量、以及时间的小时编号三种离散变量映射到d维的向量,加上用户当前位置与交互地点的距离这一连续变量拼接起来,每一个地点都被映射成了一个(3d+1)维的向量。
5.根据权利要求1所述的方法,其特征在于,所述利用元学习框架优化所述推荐模型的参数,包括:
采样:在基本城市集合中均匀采样一组Bc个城市,在每个城市中采样Bu个用户,每个用户生成训练样本和测试样本,组成每个城市c在当前轮的训练数据和测试数据
内层更新:让当前轮的初始化参数θ在每一个城市的训练数据上分别做一步或多步梯度下降,得到该城市上的最佳参数
其中,是二分类的交叉熵损失,α是内层更新的学习率;
外层更新:利用各城市上的最佳参数在该城市的测试数据上计算内层更新后最佳参数的测试损失,并把这组城市的所有测试损失求和,再通过外层更新的优化器利用反向传播来更新初始化的参数θ:
其中,β是外层更新的学习率,是当前采样的这组城市的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011333364.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于无人机、VR技术的自动解译方法
- 下一篇:一种土木工程建设桥梁支座