[发明专利]模型训练方法、装置、服务器及存储介质在审
申请号: | 202010188039.6 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111401555A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 杨鹏;唐珂;姚新 | 申请(专利权)人: | 深圳市凌雀智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;潘登 |
地址: | 518000 广东省深圳市龙华区民*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 服务器 存储 介质 | ||
本发明公开了一种模型训练方法、装置、服务器及存储介质。一种模型训练方法,包括:将样本集IPk输入训练模型集APk进行训练以得到第k次训练结果,所述第k次训练结果包括训练模型集APk+1和第k次样本标注,所述第k次样本标注为训练误差标注;根据所述第k次样本标注确认所述样本集IPk中的目标样本集IPn;根据所述目标样本集IPn生成样本集IPk+1;将所述样本集IPk+1输入所述训练模型集APk+1进行训练以得第k+1次训练结果,所述第k+1次训练结果包括训练模型集APk+2;其中,k=n,且k和n均为大于或等于1的正整数。本发明解决模型训练对样本的依赖度高的问题,实现缓解了模型训练对真实采样数据的依赖,加速人工智能技术的应用落地的效果。
技术领域
本发明实施例涉及模型训练技术,尤其涉及一种模型训练方法、装置、服务器及存储介质。
背景技术
近年来,人工智能取得了突破性的进展,已经广泛深入现实生活中,为各行各业提供了高效的、比肩甚至超越人类能力的解决方案。人工智能方法的核心,就是模型训练。目前的主流人工智能模型的训练如:生成式对抗网络(Generative Adversarial Networks,GANs),通常需要大量的已标注数据作为训练过程的输入。如果没有足够的数据,算法模型的泛化性能可能较差。但是,获取大量数据已经比较困难和昂贵,要求这些数据是已标注的就更加困难。因此,急需一种可以对已有少量已标注数据进行数据增广,同时利用增广数据对模型进行高效训练的方法。
发明内容
本发明提供一种模型训练方法、装置、服务器及存储介质,以实现缓解了模型训练对真实采样数据的依赖,加速人工智能技术的应用落地的效果。
第一方面,本发明实施例提供了一种模型训练方法,包括:
将样本集IPk输入训练模型集APk进行训练以得到第k次训练结果,所述第k次训练结果包括训练模型集APk+1和第k次样本标注,所述第k次样本标注为训练误差标注;
根据所述第k次样本标注确认所述样本集IPk中的目标样本集IPn;
根据所述目标样本集IPn生成样本集IPk+1;
将所述样本集IPk+1输入所述训练模型集APk+1进行训练以得第k+1次训练结果,所述第k+1次训练结果包括训练模型集APk+2;
其中,k=n,且k和n均为大于或等于1的正整数。
可选的,所述根据所述第k次样本标注确认所述样本集IPk中的目标样本集IPn包括:
根据所述第k次样本标注将所述样本集IPk中训练误差大于预设阈值的样本作为目标样本集IPn。
可选的,所述第k+1次训练结果还包括第k+1次样本标注,所述第k+1次样本标注为训练误差标注。
可选的,当所述k=1时,所述样本集IPk为先验知的初始样本,所述训练模型集APk为先验知的初始训练模型。
可选的,将所述样本集IPk+1输入所述训练模型集APk+1进行训练以得第k+1次训练结果之后,还包括:
判断所述训练模型集APk+1的性能是否达到预设指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市凌雀智能科技有限公司,未经深圳市凌雀智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010188039.6/2.html,转载请声明来源钻瓜专利网。