[发明专利]机器学习模型的训练方法和装置、图像的分类方法和装置在审
申请号: | 202010761644.8 | 申请日: | 2020-07-31 |
公开(公告)号: | CN113807529A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 申童;张炜;梅涛 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;许蓓 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 图像 分类 | ||
本公开涉及一种机器学习模型的训练方法和装置、图像的分类方法和装置,涉及人工智能技术领域。该训练方法包括:利用第一机器学习模型,提取待处理图片的特征向量,根据特征向量确定待处理图片的第一分类结果,待处理图片属于第一数据域或第二数据域;根据特征向量,利用第二机器学习模型,确定待处理图片的第二分类结果,第二分类结果包括待处理图片在第一数据域中的分类结果和在第二数据域中的分类结果;根据第一分类结果和第二分类结果,对第一机器学习模型和第二机器学习模型进行对抗训练,使得第二分类结果的准确率低于阈值,训练好的第一机器学习模型用于图片分类。
技术领域
本公开涉及人工智能技术领域,特别涉及一种机器学习模型的训练方法、机器学习模型的训练装置、图像的分类方法、图像的分类装置、电子设备和非易失性计算机可读存储介质。
背景技术
图像语义分割作为一种图像的分类方法是计算机视觉领域的一个重要课题,其目的是对于输入图像的每一个像素划分一个独特的语义标签。图像语义分割在许多领域中都有重要应用,如自动驾驶、图像生成等。因此,对用于图像语义分割的机器学习模型进行训练就显得尤为重要。
在相关技术中,通常依赖于大量有标注的训练数据进行训练;或者利用计算机视觉技术通过渲染生成训练数据进行训练。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:获取大量有标注的训练数据成本较高,且生成的训练数据与真实情况有偏差,导致训练效果差。
鉴于此,本公开提出了一种机器学习模型的训练技术方案,能够降低成本并提高训练效果。
根据本公开的一些实施例,提供了一种机器学习模型的训练方法,包括:利用第一机器学习模型,提取待处理图片的特征向量,根据所述特征向量确定所述待处理图片的第一分类结果,所述待处理图片属于第一数据域或第二数据域;根据所述特征向量,利用第二机器学习模型,确定所述待处理图片的第二分类结果,所述第二分类结果包括所述待处理图片在第一数据域中的分类结果和在第二数据域中的分类结果;根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练,使得所述第二分类结果的准确率低于阈值,训练好的第一机器学习模型用于图片分类。
在一些实施例中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:根据所述待处理图片属于的数据域,以及所述第一分类结果,生成第一标注结果;根据所述第二分类结果和所述第一标注结果,计算第一损失函数;根据所述第一损失函数训练所述第二机器学习模型。
在一些实施例中,所述第一数据域中的图片为人工生成的虚拟图片,所述第二数据域中的图片为实际采集的真实图片。
在一些实施例中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:在所述待处理图片属于第二数据域的情况下,生成所述待处理图片的第二标注结果,所述第二标注结果将所述待处理图片标注为属于第一数据域;根据所述第二分类结果和所述第二标注结果计算第二损失函数;根据所述第二损失函数训练所述第一机器学习模型。
在一些实施例中,所述根据所述第一分类结果和所述第二分类结果,对所述第一机器学习模型和所述第二机器学习模型进行对抗训练包括:在所述待处理图片属于第一数据域的情况下,根据所述第一分类结果和所述待处理图片的第三标注结果计算第三损失函数,所述第三标注结果用于标注所述待处理图片所属的图像类型;根据所述第三损失函数训练所述第一机器学习模型。
在一些实施例中,所述根据所述待处理图片属于的数据域,以及所述第一分类结果,生成第一标注结果包括:在所述待处理图片属于的第一数据域的情况下,在所述第一分类结果后面加标识位,生成所述第一标注结果,所述标识位的个数与所有图像类型的个数相同;在所述待处理图片属于的第二数据域的情况下,在所述第一分类结果前面加所述标识位,生成所述第一标注结果,所述标识位的个数与所有图像类型的个数相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010761644.8/2.html,转载请声明来源钻瓜专利网。