[发明专利]一种针对二维图像中的多尺度多形态目标的自动检测方法有效
申请号: | 201911240172.5 | 申请日: | 2019-12-06 |
公开(公告)号: | CN111027547B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 徐源;龚黎;方晗;吴敏;孔文韬;袁杰 | 申请(专利权)人: | 南京大学;南京鼓楼医院 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/46;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 二维 图像 中的 尺度 形态 目标 自动检测 方法 | ||
本发明提供了一种针对二维图像中的多尺度多形态目标的自动检测方法,包括:对二维图像进行预处理;对预处理后的图像进行目标的标注,完成数据集的制作;在目标检测网络的基础特征提取网络中加入空间映射层,将空间映射后的特征图和其他特征图一起融合构成特征金字塔以适应二维图像中目标的变化;在多个融合特征图构成的特征金字塔上使用具有良好先验的锚框完成区域推荐;使用制作好的数据集训练改进后的目标检测网络,进行多次交叉验证;使用训练好的目标检测模型对可能含有目标的图片进行检测,选定阈值筛选出包含目标可能性较大的检测框并对筛选出的检测框进行非极大值抑制,去除重叠框,得到最终准确率较高的目标检测结果。
技术领域
本发明属于图像分析及目标检测领域,尤其涉及一种针对二维图像中的多尺度多形态目标的自动检测方法。
背景技术
视觉场景中广泛分布着具有几何形变的待识别目标,二维图像的多尺度多形态目标自动检测有利于在非受控自然场景中快速准确地进行目标定位和识别。目前的二维图像目标检测方法对形态尺度多变的目标检测结果缺乏一定鲁棒性,而依靠人为观察校正费时费力,疲劳、经验等人为主观因素会影响观察结果的准确性与一致性。
发明内容
发明目的:本发明所要解决的技术问题是针对现有二维图像中多尺度多形态目标检测效果较差的情况,基于深度学习中的卷积神经网络和基本图像处理方法,提供了一种针对二维图像中的多尺度多形态目标的自动检测方法,实现了对多尺度多形态目标的精确检测。
为了解决上述技术问题,本发明公开了一种针对二维图像中的多尺度多形态目标的自动检测方法,包括如下步骤:
步骤1,对原始图像进行预处理,通过人工裁切,去除图像周边空白以及无用文字信息区域,提取出有效图像区域待检测;
步骤2,对预处理后的图像进行标注,框出目标所在位置并制作标签,图像和其对应标签共同构成数据集,供后续模型训练;
步骤3,将图像输入以残差网络ResNet101为基础特征提取网络的目标检测网络,在目标检测网络的基础特征提取网络ResNet101中加入空间映射层,将空间映射后的特征图和其他特征图一起融合构成特征金字塔以适应二维图像中目标形态的变化;
步骤4,在多个融合特征图构成的特征金字塔上使用具有良好先验的锚框完成区域推荐,区域推荐网络生成的感兴趣区域ROI(region ofinterest)经过感兴趣区域池化方法ROI Align后变形成具有相同大小的特征图,特征图经由Fast R-CNN分类和位置回归后得到最终的检测结果;
步骤5,使用数据集训练通过步骤3和步骤4改进后的目标检测网络,将数据集随机划分为n1(一般取值为5)份相互独立的数据集合,在不同次训练中,每次选取一份用作测试集,其余部分用作训练集,以此进行交叉验证;
步骤6,使用训练好的目标检测模型对可能含有目标的图片进行检测,选定阈值筛选出包含目标可能性较大的检测框并对筛选出的检测框进行非极大值抑制(Non-MaximumSuppression,NMS),去除重叠框,得到最终准确率较高的目标检测结果。
步骤1中,采集到的原始图像包含不利于目标定位及分类的人工标记和空白区域,影响该方法最终对目标的检测结果,因此在制作数据集前,首先通过裁剪去除图像中的冗余信息,保留真正有效的图像区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;南京鼓楼医院,未经南京大学;南京鼓楼医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911240172.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种识别数字串读法的方法及装置
- 下一篇:一种管道的制作工艺
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序