[发明专利]一种目标检测方法、装置、存储介质及终端在审
申请号: | 202110198093.3 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112906794A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 廖玲;刘志昌;张亚昇 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京煦润律师事务所 11522 | 代理人: | 高莹;梁永芳 |
地址: | 519070*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 装置 存储 介质 终端 | ||
1.一种目标检测方法,其特征在于,包括:
获取预先进行过标注的图像样本;所述标注包括:标注目标物体的类别和目标物体在图像中的坐标;
将获取的图像样本输入预设的CSPDarknet53网络结构中进行特征提取得到特征图;
对得到的特征图进行卷积处理、上采样处理以及特征融合,得到目标物体的特征信息;所述特征信息,包括:位置信息和语义特征信息;
根据所述目标物体的特征信息进行边框预测,得到预测边框的边框信息和类别置信度,并在得到的预测边框中筛选出检测框;
根据筛选出的所述检测框计算边框损失和类别损失,并根据计算得到的边框损失和类别损失更新权重参数,得到用于进行目标检测的网络模型;
将待检测的图像输入所述网络模型中进行目标检测,并在所述图像中对所述目标物体进行标注。
2.根据权利要求1所述的方法,其特征在于,采用以下的公式计算得到预测边框:
bx=σ(tx)+cx,by=σ(ty)+cy,
其中,pw,ph分别表示锚框的宽和高,tx、ty表示网络预测的坐标偏移值,tw、th表示网络预测的缩放尺度,σ(tx)、σ(ty)分别表示对tx、ty进行Sigmoid函数激活处理;cx、cy分别表示预测边框所在的网格在图像中的相对位置,bx,by表示预测边框的中心点坐标,bw,bh分别表示预测边框的宽、高。
3.根据权利要求1或2所述的方法,其特征在于,
将获取的图像样本输入预设的CSPDarknet53网络结构中进行特征提取之前,还包括:
对所述图像样本进行预处理,包括:
对所述图像样本采用预设的数据增强的方式进行数据增强;
和/或,
对所述图像样本进行缩放处理,使缩放后的纵横像素点数均为32的倍数;其中,输入所述CSPDarknet53网络的图像进行五次下采样;
和/或,
将待检测的图像输入所述神经网络模型中进行目标检测之前,还包括:
对所述待检测的图像进行缩放处理,使缩放后的纵横像素点数均为32的倍数。
4.根据权利要求1或2所述的方法,其特征在于,对得到的特征图进行卷积处理、上采样以及特征融合,得到目标物体的特征信息,包括:
将每次经过卷积处理和上采样得到的特征图与在所述CSPDarknet53网络中下采样得到的尺寸相同的特征图进行特征融合后,通过跨阶段局部融合层进行跨阶段局部融合。
5.一种目标检测装置,其特征在于,包括:
获取单元,用于获取预先进行过标注的图像样本;所述标注包括:标注目标物体的类别和目标物体在图像中的坐标;
特征提取单元,用于将获取的图像样本输入预设的CSPDarknet53网络结构中进行特征提取得到特征图;
特征融合单元,用于对得到的特征图进行卷积处理、上采样处理以及特征融合,得到目标物体的特征信息;所述特征信息,包括:位置信息和语义特征信息;
边框预测单元,用于根据所述目标物体的特征信息进行边框预测,得到预测边框的边框信息和类别置信度,并在得到的预测边框中筛选出检测框;
参数更新单元,用于根据筛选出的所述检测框计算边框损失和类别损失,并根据计算得到的边框损失和类别损失更新权重参数,得到用于进行目标检测的网络模型;
目标检测单元,用于将待检测的图像输入所述网络模型中进行目标检测,并在所述图像中对所述目标物体进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110198093.3/1.html,转载请声明来源钻瓜专利网。