[发明专利]一种目标检测方法及系统在审
申请号: | 202010687963.9 | 申请日: | 2020-07-16 |
公开(公告)号: | CN111898659A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 张启坤;吴臻志 | 申请(专利权)人: | 北京灵汐科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 周倩 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 系统 | ||
本发明公开了一种目标检测方法及系统,对待检测的图像提取多尺度特征,并进行多个尺度的特征融合,得到融合后的多个特征图;对所述融合后的多个特征图进行目标检测处理,得到目标检测结果,所述目标检测结果包括至少一个目标的位置信息以及分类信息。本发明的一种目标检测方法及系统,可以在确保检测准确度的情况下,实现对不同尺度目标的同时检测。
技术领域
本发明涉及目标检测技术领域,具体而言,涉及一种目标检测方法及系统。
背景技术
目前对图像中的小目标例如人头、人脸等进行检测时,一般是基于传统图像特征和级联分类器进行检测,检测准确度较低,泛化性和鲁棒性都比较差。也有基于深度学习的检测,但无法实现对不同尺度目标的同时检测。
发明内容
为解决上述问题,本发明的目的在于提供一种目标检测方法及系统,可以在确保检测准确度的情况下,实现对不同尺度目标的同时检测。
本发明提供了一种目标检测方法,包括:
对待检测的图像提取多尺度特征,并进行多个尺度的特征融合,得到融合后的多个特征图;
对所述融合后的多个特征图进行目标检测处理,得到目标检测结果,所述目标检测结果包括至少一个目标的位置信息以及分类信息。
作为本发明进一步的改进,对待检测的图像提取多尺度特征,并进行多个尺度的特征融合,得到融合后的多个特征图,包括:
对待检测的图像进行下采样处理,提取多尺度特征,得到多个尺度的第一特征图;
对所述多个尺度的第一特征图分别进行上采样处理,得到与第一特征图各尺度分别相同的多个第二特征图;
将尺度相同的第一特征图和第二特征图进行特征融合,得到融合后的多个特征图。
作为本发明进一步的改进,对所述融合后的多个特征图进行目标检测处理,得到目标检测结果,包括:
对所述融合后的多个特征图分别进行检测处理,并通过多个尺寸的宽高校准比例系数矫正检测框的宽高比,得到每个融合后的特征图中至少一个目标的位置信息和分类信息;对所述每个融合后的特征图中至少一个目标的位置信息进行尺寸变换还原到原图像尺寸,得到每个目标在原图上的多个位置信息;
对所述每个目标在原图上的多个位置信息按照分类信息从大到小进行排序,并通过NMS算法进行去重处理,得到每个目标的目标检测结果。
作为本发明进一步的改进,所述方法通过神经网络实现,所述方法还包括:根据训练集训练所述神经网络。
作为本发明进一步的改进,所述神经网络包括:分组卷积层、反卷积层和融合层,所述分组卷积层以及所述反卷积层用于对待检测的图像提取多尺度特征。
作为本发明进一步的改进,所述训练集包括多个样本图像,各所述样本图像包括标注信息,所述方法还包括:根据各所述样本图像的标注信息,确定多个尺寸的宽高校准比例系数,其中,所述多个尺寸的宽高校准比例系数用于在所述神经网络训练过程以及目标检测过程中,矫正检测框的宽高比。
作为本发明进一步的改进,所述标注信息包括标注框,其中,根据各所述样本图像的标注信息,确定多个尺寸的宽高校准比例系数,包括:
S11,在所述数据集中选取k个不同聚类的初始目标框Ci,i∈{1,2,..,k},其中,初始目标框Ci表示宽wi和高hi与坐标原点(0,0)围成的检测框;
S21,确定各标注框Xi到每个初始目标框Ci的距离Di,根据所述距离Di将所述各标注框Xi分配至最近的初始目标框Ci所代表的聚类,其中,所述各标注框Xi表示所述数据集中各样本图像的宽和高与坐标原点(0,0)围成的标注框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵汐科技有限公司,未经北京灵汐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010687963.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动排气阀
- 下一篇:余热锅炉及垃圾焚烧系统