[发明专利]对推荐模型的训练样本进行样本域转换的方法及装置有效
申请号: | 202010205866.1 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111428783B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 王冠楠 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 模型 训练 样本 进行 转换 方法 装置 | ||
本说明书实施例提供了一种用于对训练样本进行样本域转换的方法及装置,在该方法中,获取第一样本域下的第一训练样本和第二样本域下的第二训练样本,使用第一样本迁移转换过程将第二训练样本迁移转换成第三训练样本,其中,第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。在满足第一约束条件时将第三训练样本确定为第一样本域下的训练样本。
技术领域
本说明书实施例涉及机器学习技术领域,具体地,涉及对推荐模型的训练样本进行样本域转换的方法及装置。
背景技术
每个场景下的样本可以反映出该场景的业务特点,基于此,不同的场景下的样本会存在差异。例如,新零售时代推出的以适应大众的购物需求的“双十一”、“手机节”等各种业务模式,每种业务模式即是一种场景,不同的业务模式有不同的业务特点,比如,针对的消费群体、商品类型等不同,因此,不同的业务模式冷启动所需的样本会不同,比如,“手机节”场景下的样本主要是手机,而“双十一”场景下的样本主要是服装等。
对于较成熟的场景,样本的数量较丰富。而对于新场景来说,相应的样本数量会较少,甚至样本的数量达不到冷启动的要求。此时,需要增加新场景中的样本,一种增加方式是利用成熟场景中的样本来增加新场景中的样本。
发明内容
鉴于上述,本说明书实施例提供了一种对推荐模型的训练样本进行样本域转换的方法及装置。在该方法中,在获取第一样本域下的第一训练样本和第二样本域下的第二训练样本后,使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下的第三训练样本,其中,第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。通过上述方法,第一约束条件使得第三训练样本可以适用于第一样本域的场景,由此扩充了第一样本域下的训练样本,再利用扩充后的第一样本域下的训练样本可以训练出相应的推荐模型。
根据本说明书实施例的一个方面,提供了一种对推荐模型的训练样本进行样本域转换的方法,包括:获取第一样本域下的第一训练样本和第二样本域下的第二训练样本;其中,所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型,所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型,所述第一训练样本包括针对所述第一类商品的样本,所述第二训练样本包括针对所述第二类商品的样本;使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本;以及将所述第三训练样本确定为所述第一样本域下的训练样本,以使得基于所确定的训练样本来训练所述第一推荐模型,其中,所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的,所述第一约束条件包括:当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值,其中,每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与所述第一训练样本之间的分布式距离。
可选地,在上述方面的一个示例中,所述第一训练样本和所述第二训练样本是有监督训练样本,以及所述第一约束条件还包括:所述第三训练样本的训练误差小于第二阈值,以及所述第一训练样本的预测误差小于第三阈值,其中,所述第一训练样本的预测值是使用第一预测模型预测的,所述第一预测模型是利用所述第三训练样本训练出的。
可选地,在上述方面的一个示例中,还包括:使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本,其中,所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的;以及将所述第三训练样本确定为所述第一样本域下的训练样本包括:当所述第四训练样本满足第三约束条件时,将所述第三训练样本确定为所述第一样本域下的训练样本,其中,所述第三约束条件包括:所述第四训练样本与所述第二训练样本之间的分布式距离小于第四阈值。
可选地,在上述方面的一个示例中,所述第二训练样本和所述第四训练样本是有监督训练样本,以及所述第三约束条件还包括:所述第四训练样本的训练误差小于第五阈值,以及所述第二训练样本的预测误差小于第六阈值,其中,所述第二训练样本的预测值是使用第二预测模型预测的,所述第二预测模型是利用所述第四训练样本训练出的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010205866.1/2.html,转载请声明来源钻瓜专利网。