[发明专利]一种目标检测模型的训练方法及相关装置在审
申请号: | 202111591732.9 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114332479A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 赵健;史宏志;金良 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/774;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王晓芬 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 模型 训练 方法 相关 装置 | ||
本申请公开了一种目标检测模型的训练方法,包括:采用待训练模型的骨干网络对图像进行特征提取操作,得到多尺度特征图;基于多尺度可变形注意力编码模块对所述多尺度特征图进行编码,得到已编码图像特征;基于所述图像的正确标注进行序列构建处理,得到目标序列;基于多尺度可变形注意力解码模块对所述已编码图像特征和所述目标序列进行解码,得到预测序列;基于预设损失函数、所述预测序列和所述图像的正确标注的目标序列对对所述待训练模型进行参数更新。使得可以处理高复杂度的特征图,提高模型处理的效率和性能。本申请还公开了一种目标检测模型的训练装置、服务器以及计算机可读存储介质,具有以上有益效果。
技术领域
本申请涉及机器学习技术领域,特别涉及一种目标检测模型的训练方法、训练装置、服务器以及计算机可读存储介质。
背景技术
相关技术中,PIX2SEQ(一种目标检测架构)虽将目标检测任务转化为语言模型的生成任务,但内部仍使用transformer,由于transformer本身特点,在处理图像特征时,会计算当前位置与所有其他位置之间关系,复杂度正比于特征图尺寸,导致无法使用大尺寸或多尺寸特征,进而影响模型的性能。
因此,如何保持进行处理过程中的效率是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种目标检测模型的训练方法、训练装置、服务器以及计算机可读存储介质,使得可以处理高复杂度的特征图,提高模型处理的效率和性能。
为解决上述技术问题,本申请提供一种目标检测模型的训练方法,包括:
采用待训练模型的骨干网络对图像进行特征提取操作,得到多尺度特征图;
基于多尺度可变形注意力编码模块对所述多尺度特征图进行编码,得到已编码图像特征;
基于所述图像的正确标注进行序列构建处理,得到目标序列;
基于多尺度可变形注意力解码模块对所述已编码图像特征和所述目标序列进行解码,得到预测序列;
基于预设损失函数、所述预测序列和所述图像的正确标注的目标序列对所述待训练模型进行参数更新。
可选的,采用待训练模型的骨干网络对图像进行特征提取操作,得到多尺度特征图,包括:
对所述图像进行图像增强处理,得到已变换图像;
基于所述骨干网络对所述已变换图像进行图像特征提取操作,得到所述多尺度特征图。
可选的,基于多尺度可变形注意力编码模块对所述多尺度特征图进行编码,得到已编码图像特征,包括:
从所述多尺度特征图中获取每个尺度的图像特征;
对所述图像特征中每个特征点位置进行编码,得到位置编码;
将所述每个尺度的图像特征的融合特征与所述位置编码进行融合,得到编码输入;
基于所述多尺度可变形注意力编码模块对所述编码输入进行编码,得到所述已编码图像特征。
可选的,基于所述图像的正确标注进行序列构建处理,得到目标序列,包括:
将所述图像中的正确标记进行尺寸归一化处理,得到归一化图像;
对所述归一化图像中的任一个目标进行序列构建处理,得到所述目标序列。
可选的,基于预设损失函数、所述预测序列和所述图像的正确标注的目标序列对所述待训练模型进行参数更新,包括:
基于所述待训练模型的模型结构构建损失函数;
基于所述损失函数、所述预测序列和所述图像的正确标注的目标序列对所述待训练模型进行参数更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111591732.9/2.html,转载请声明来源钻瓜专利网。