[发明专利]对推荐模型的训练样本进行样本域转换的方法及装置有效

申请号：	202010205866.1	申请日：	2020-03-23
公开（公告）号：	CN111428783B	公开（公告）日：	2022-06-21
发明（设计）人：	王冠楠	申请（专利权）人：	支付宝（杭州）信息技术有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N20/00
代理公司：	北京永新同创知识产权代理有限公司 11376	代理人：	林锦辉;刘景峰
地址：	310000 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	推荐模型训练样本进行转换方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书实施例提供了一种用于对训练样本进行样本域转换的方法及装置，在该方法中，获取第一样本域下的第一训练样本和第二样本域下的第二训练样本，使用第一样本迁移转换过程将第二训练样本迁移转换成第三训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。在满足第一约束条件时将第三训练样本确定为第一样本域下的训练样本。

技术领域

本说明书实施例涉及机器学习技术领域，具体地，涉及对推荐模型的训练样本进行样本域转换的方法及装置。

背景技术

每个场景下的样本可以反映出该场景的业务特点，基于此，不同的场景下的样本会存在差异。例如，新零售时代推出的以适应大众的购物需求的“双十一”、“手机节”等各种业务模式，每种业务模式即是一种场景，不同的业务模式有不同的业务特点，比如，针对的消费群体、商品类型等不同，因此，不同的业务模式冷启动所需的样本会不同，比如，“手机节”场景下的样本主要是手机，而“双十一”场景下的样本主要是服装等。

对于较成熟的场景，样本的数量较丰富。而对于新场景来说，相应的样本数量会较少，甚至样本的数量达不到冷启动的要求。此时，需要增加新场景中的样本，一种增加方式是利用成熟场景中的样本来增加新场景中的样本。

发明内容

鉴于上述，本说明书实施例提供了一种对推荐模型的训练样本进行样本域转换的方法及装置。在该方法中，在获取第一样本域下的第一训练样本和第二样本域下的第二训练样本后，使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下的第三训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。通过上述方法，第一约束条件使得第三训练样本可以适用于第一样本域的场景，由此扩充了第一样本域下的训练样本，再利用扩充后的第一样本域下的训练样本可以训练出相应的推荐模型。

根据本说明书实施例的一个方面，提供了一种对推荐模型的训练样本进行样本域转换的方法，包括：获取第一样本域下的第一训练样本和第二样本域下的第二训练样本；其中，所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型，所述第一训练样本包括针对所述第一类商品的样本，所述第二训练样本包括针对所述第二类商品的样本；使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本；以及将所述第三训练样本确定为所述第一样本域下的训练样本，以使得基于所确定的训练样本来训练所述第一推荐模型，其中，所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，所述第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与所述第一训练样本之间的分布式距离。

可选地，在上述方面的一个示例中，所述第一训练样本和所述第二训练样本是有监督训练样本，以及所述第一约束条件还包括：所述第三训练样本的训练误差小于第二阈值，以及所述第一训练样本的预测误差小于第三阈值，其中，所述第一训练样本的预测值是使用第一预测模型预测的，所述第一预测模型是利用所述第三训练样本训练出的。

可选地，在上述方面的一个示例中，还包括：使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本，其中，所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及将所述第三训练样本确定为所述第一样本域下的训练样本包括：当所述第四训练样本满足第三约束条件时，将所述第三训练样本确定为所述第一样本域下的训练样本，其中，所述第三约束条件包括：所述第四训练样本与所述第二训练样本之间的分布式距离小于第四阈值。

可选地，在上述方面的一个示例中，所述第二训练样本和所述第四训练样本是有监督训练样本，以及所述第三约束条件还包括：所述第四训练样本的训练误差小于第五阈值，以及所述第二训练样本的预测误差小于第六阈值，其中，所述第二训练样本的预测值是使用第二预测模型预测的，所述第二预测模型是利用所述第四训练样本训练出的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于支付宝（杭州）信息技术有限公司，未经支付宝（杭州）信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010205866.1/2.html，转载请声明来源钻瓜专利网。

上一篇：辅机电动机参数对厂用电系统影响的仿真评估方法及装置
下一篇：车身颜色处理方法、装置及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]对推荐模型的训练样本进行样本域转换的方法及装置有效

专利文献下载