[发明专利]机器学习模型的训练方法和装置、图像的分类方法和装置在审
申请号: | 202010761644.8 | 申请日: | 2020-07-31 |
公开(公告)号: | CN113807529A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 申童;张炜;梅涛 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;许蓓 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 图像 分类 | ||
1.一种机器学习模型的训练方法,包括:
利用第一机器学习模型,提取待处理图片的特征向量,根据所述特征向量确定所述待处理图片的第一分类结果,所述待处理图片属于第一数据域或第二数据域;
根据所述特征向量,利用第二机器学习模型,确定所述待处理图片的第二分类结果,所述第二分类结果包括所述待处理图片在第一数据域中的分类结果和在第二数据域中的分类结果;
根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练,使得所述第二分类结果的准确率低于阈值,训练好的第一机器学习模型用于图片分类。
2.根据权利要求1所述的训练方法,其中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:
根据所述待处理图片属于的数据域,以及所述第一分类结果,生成第一标注结果;
根据所述第二分类结果和所述第一标注结果,计算第一损失函数;
根据所述第一损失函数训练所述第二机器学习模型。
3.根据权利要求1所述的训练方法,其中,
所述第一数据域中的图片为人工生成的虚拟图片,
所述第二数据域中的图片为实际采集的真实图片。
4.根据权利要求3所述的训练方法,其中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:
在所述待处理图片属于第二数据域的情况下,生成所述待处理图片的第二标注结果,所述第二标注结果将所述待处理图片标注为属于第一数据域;
根据所述第二分类结果和所述第二标注结果计算第二损失函数;
根据所述第二损失函数训练所述第一机器学习模型。
5.根据权利要求3所述的训练方法,其中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:
在所述待处理图片属于第一数据域的情况下,根据所述第一分类结果和所述待处理图片的第三标注结果计算第三损失函数,所述第三标注结果用于标注所述待处理图片所属的图像类型;
根据所述第三损失函数训练所述第一机器学习模型。
6.根据权利要求2所述的训练方法,其中,所述根据所述待处理图片属于的数据域,以及所述第一分类结果,生成第一标注结果包括:
在所述待处理图片属于的第一数据域的情况下,在所述第一分类结果后面加标识位,生成所述第一标注结果,所述标识位的个数与所有图像类型的个数相同;
在所述待处理图片属于的第二数据域的情况下,在所述第一分类结果前面加所述标识位,生成所述第一标注结果,所述标识位的个数与所有图像类型的个数相同。
7.根据权利要求1-6任一项所述的训练方法,其中,
所述第一分类结果为所述待处理图片中每一个像素属于各图像类型的概率,
所述待处理图片在第一数据域中的分类结果为所述待处理图片中每一个像素在第一数据域中属于各图像类型的概率,
所述待处理图片在第二数据域中的分类结果为所述待处理图片中每一个像素在第二数据域中属于各图像类型的概率。
8.根据权利要求1-6任一项所述的训练方法,还包括:
利用训练好的第一机器学习模型进行图片分类。
9.一种图像的分类方法,包括:
获取待处理图片;
利用第一机器学习模型,对所述待处理图片进行分类,所述第一机器学习模型根据权利要求1-7任一项所述的训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010761644.8/1.html,转载请声明来源钻瓜专利网。