[发明专利]目标跟踪分割模型的训练方法和目标跟踪分割方法及装置在审
申请号: | 202110219025.0 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112949458A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 王伟农;戴宇荣 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;朱志玲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 跟踪 分割 模型 训练 方法 装置 | ||
1.一种目标跟踪分割模型的训练方法,其特征在于,包括:
获取图像样本数据,其中,每个图像样本数据包括目标图像、跟踪图像以及目标掩膜图像,其中,所述目标图像是指包括将被跟踪的目标的图像,所述跟踪图像是指将被执行跟踪所述目标的图像,所述目标掩膜图像是指预先标记好的目标真值的掩膜图像;
将所述目标图像和所述跟踪图像输入所述目标跟踪分割模型,得到不同分辨率的多个特征图,其中,所述目标跟踪分割模型为SiamMask模型;
分别对所述多个特征图中的每个特征图执行处理,产生分辨率相同的多个目标前景概率图;
将所述多个目标前景概率图执行融合,产生最终目标前景概率图;
基于所述多个目标前景概率图和所述最终目标前景概率图中的每个目标前景概率图与所述目标掩膜图像,确定损失函数,从而得到多个损失函数;
根据所述多个损失函数来调整所述目标跟踪分割模型的参数,以对所述目标跟踪分割模型进行训练。
2.如权利要求1所述的训练方法,其特征在于,所述目标跟踪分割模型包括ResNet-50层、深度可分离卷积的互相关操作层,其中,所述目标图像和所述跟踪图像经过所述ResNet-50层和所述深度可分离卷积的互相关操作层,产生多个候选窗响应特征;
其中,所述多个特征图是基于所述多个候选窗响应特征中的第一候选窗响应特征以及所述目标图像通过所述ResNet-50层产生的不同中间阶段特征图而产生的。
3.如权利要求2所述的训练方法,其特征在于,第一候选窗响应特征是通过以下操作选择的:
对所述多个候选窗响应特征中的每个候选窗响应特征执行目标背景分类,获得每个候选窗响应特征是否是目标区域特征的置信度分数;
选择置信度分数最高的候选窗响应特征作为第一候选窗响应特征。
4.如权利要求2所述的训练方法,其特征在于,所述多个特征图包括第一分辨率特征图、第二分辨率特征图、第三分辨率特征图和第四分辨率特征图;
其中,第一分辨率特征图是对第一候选窗响应特征执行反卷积而得到的特征图;
第二分辨率特征图是对第一分辨率特征图和所述目标图像通过所述ResNet-50层产生的第三阶段特征图执行融合而得到的特征图,其中,第一分辨率特征图和第三阶段特征图的分辨率相同;
第三分辨率特征图是对第二分辨率特征图和所述目标图像通过所述ResNet-50层产生的第二阶段特征图执行融合而得到的特征图,其中,第二分辨率特征图和第二阶段特征图的分辨率相同;
第四分辨率特征图是对第三分辨率特征图和所述目标图像通过所述ResNet-50层产生的第一阶段特征图执行融合而得到的特征图,其中,第三分辨率特征图和第一阶段特征图的分辨率相同;
其中,第一分辨率特征图、第二分辨率特征图、第三分辨率特征图和第四分辨率特征图的分辨率依次增大,第四分辨率特征图和所述目标掩膜图像的分辨率相同。
5.一种目标跟踪分割方法,其特征在于,包括:
获取待跟踪的目标图像和跟踪图像,其中,所述目标图像是指包括待跟踪的目标的图像,所述跟踪图像是指将被执行跟踪所述目标的图像;
将所述目标图像和所述跟踪图像输入目标跟踪分割模型,得到不同分辨率的多个特征图,其中,所述目标跟踪分割模型为SiamMask模型;
分别对所述多个特征图中的每个特征图执行处理,产生分辨率相同的多个目标前景概率图;
将所述多个目标前景概率图执行融合,产生最终目标前景概率图;
基于所述最终目标前景概率图和所述跟踪图像,获得目标跟踪分割结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110219025.0/1.html,转载请声明来源钻瓜专利网。