[发明专利]实例分割模型的训练方法、装置、系统及存储介质在审
申请号: | 202110722507.8 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113673505A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 付子昂;王剑锋 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06T3/00 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;张玮 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实例 分割 模型 训练 方法 装置 系统 存储 介质 | ||
本发明的实施例提供了一种实例分割模型的训练方法、装置、系统及存储介质。该方法包括:获取训练图像和对应的标注数据;对训练图像执行仿射变换操作,以获得变换后的训练图像;将训练图像输入实例分割模型,以对训练图像进行实例分割并获得第一预测掩码;将变换后的训练图像输入实例分割模型,以对变换后的训练图像进行实例分割并获得第二预测掩码;对第一预测掩码执行仿射变换操作,以获得变换后的掩码;基于真实包围框、第一预测掩码、变换后的掩码和第二预测掩码确定主损失函数的函数值;基于主损失函数的函数值训练实例分割模型。这不仅提升了实例分割模型的自主学习能力,还增强了其泛化性,能够获得更准确的实例分割结果。
技术领域
本发明涉及计算机视觉技术领域,更具体地涉及一种实例分割模型的训练方法、装置、系统及存储介质。
背景技术
实例分割是一种在像素层面识别目标掩码的计算机视觉任务。目的是在图像上找到感兴趣的目标,并给出目标的类别和像素级别的分割结果。
常见的实例分割模型的训练大多是基于像素级别的标注实现的。相比于目标框级别的包围框标注,像素级别的标注需要更高的人力标注成本和更长时间的标注周期。
因此,为了降低进行像素级别标注花费的高额成本,也有些现有技术中采用基于包围框的弱监督实例分割训练方法作为替代。该方法可以使实例分割模型自主学习包围框内的分割知识,达到与有监督的实例分割方法相近的结果。现有技术中的基于包围框的弱监督实例分割方法大致分为以下两种:一种基于颜色等与目标有关的先验信息实现,另一种通过利用传统算法生成伪分割标注实现。
但上述两种方法不仅缺乏泛化性,还容易受图像或目标的明暗差异等因素的影响,从而限制了实例分割模型的上限能力,难以获得高精度的实例分割模型。
发明内容
考虑到上述问题而提出了本发明。根据本发明的一个方面,提供了一种实例分割模型的训练方法。包括:获取训练图像和对应的标注数据,其中标注数据包括训练图像中目标的真实包围框的位置信息。对训练图像执行仿射变换操作,以获得变换后的训练图像。将训练图像输入实例分割模型,以对训练图像进行实例分割并获得第一预测掩码。将变换后的训练图像输入实例分割模型,以对变换后的训练图像进行实例分割并获得第二预测掩码。对第一预测掩码执行仿射变换操作,以获得变换后的掩码。基于真实包围框、第一预测掩码、变换后的掩码和第二预测掩码确定主损失函数的函数值。基于主损失函数的函数值训练实例分割模型。
示例性地,将训练图像输入实例分割模型以对训练图像进行实例分割并获得第一预测掩码,包括:将训练图像输入实例分割模型,获得目标的第一包围框和第一包围框的得分。根据第一包围框和第一包围框的得分,确定第一预测掩码。
示例性地,方法还包括:基于真实包围框、第一包围框和第一包围框的得分确定第一辅助损失函数的函数值。其中,训练实例分割模型还同时基于第一辅助损失函数的函数值。
示例性地,将变换后的训练图像输入实例分割模型以对变换后的训练图像进行实例分割并获得第二预测掩码,包括:将变换后的训练图像输入实例分割模型,获得目标的第二包围框和第二包围框的得分。根据第二包围框和第二包围框的得分,确定第二预测掩码。方法还包括:确定变换后的掩码的最小包围框;以及基于最小包围框、第二包围框和第二包围框的得分确定第二辅助损失函数的函数值。其中,训练实例分割模型还同时基于第二辅助损失函数的函数值。
示例性地,基于真实包围框、第一预测掩码、变换后的掩码和第二预测掩码确定主损失函数的函数值包括:基于真实包围框和第一预测掩码计算第一主导损失函数的函数值。基于变换后的掩码和第二预测掩码计算第二主导损失函数的函数值。基于第一主导损失函数的函数值和第二主导损失函数的函数值计算主损失函数的函数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110722507.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种判断高炉炉缸侵蚀状况的方法
- 下一篇:一种墙体高隔声穿线方法