[发明专利]一种业务模型训练方法和装置有效
申请号: | 202010566083.6 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111539490B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 张雅淋 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张静娟;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 模型 训练 方法 装置 | ||
本说明书实施例提供了一种业务模型训练方法和装置,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。
技术领域
本说明书实施例涉及机器学习技术领域,更具体地,涉及一种业务模型训练方法和装置。
背景技术
在互联网的应用场景中,每天会有大量的数据需要分析,而机器学习作为一种技术手段,正在越来越多的场景中发挥着作用。对于给定的任务,为取得良好的部署效果,可通过集成学习来集成多个不同的分类模型,而提升整体的集成模型的泛化性能。对于集成学习而言,有两个关键的因素需要考虑:其一是单个分类模型的准确率(accuracy),其二是分类模型间的多样性(diversity),只有做到“好而不同”,才有利于整体的集成模型取得更好的效果。然而,目前的方法中,获得多样性的主要办法是通过采集训练样本获得多个不同的训练样本集,来训练集成模型中的各个分类模型。
因此,需要一种更有效的业务模型训练方案。
发明内容
本说明书实施例旨在提供一种更有效的业务模型训练方案,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种由计算机执行的业务模型训练方法,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述方法包括:
获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;
通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;
生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;
以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。
在一种实施方式中,将所述特征数据转换为n个不同的转换数据包括,通过以下任一模型将所述特征数据映射为映射数据:随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。
在一种实施方式中,将所述特征数据转换为n个不同的转换数据还包括,在将所述特征数据映射为映射数据之后,将所述映射数据与所述特征数据拼接,以获取转换数据。
在一种实施方式中,将所述特征数据转换为n个不同的转换数据还包括,将所述特征数据转换为维度减少的转换数据。
在一种实施方式中,所述业务对象为以下任一对象:用户、商户、商品、交易。
本说明书另一方面提供一种部署于计算机中的业务模型训练装置,所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型,其中n为大于1的自然数,所述装置包括:
获取单元,配置为,获取第一训练样本,所述第一训练样本包括业务对象的特征数据和业务对象的标签值;
转换单元,配置为,通过所述n个转换模型,将所述特征数据转换为n个不同的转换数据;
生成单元,配置为,生成n个不同的第二训练样本,每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值;
训练单元,配置为,以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010566083.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:时钟自动校准电路及方法
- 下一篇:一种深度交联固化硅酮嵌缝材料及其制备方法