[发明专利]一种基于区域提名的小目标检测方法有效
申请号: | 201810456924.0 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108830280B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 张宇;郑冬云;郭炜强;郑波;关健创 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/36;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区域 提名 目标 检测 方法 | ||
1.一种基于区域提名的小目标检测方法,其特征在于,包括以下步骤:
1)输入图像预处理,将输入图像转换为统一大小;
2)提取图像基础特征图,提取5层特征图;
3)特征融合,融合图像第4层与第5层特征图;
4)小目标区域提名,使用区域提名网络产生小目标区域提名;
5)小目标边界框精修以及小目标区域分类,具体如下:
在得到的提名区域概率和边界范围基础上,使用非极大值抑制算法对产生的提名区域进行过滤,即将产生的提名区域中包含物体的概率低于设定阈值的提名区域过滤掉,最终将包含物体概率高于设定阈值的提名区域作为参数传入下一阶段,在具体应用中,每张图像中所包含的小目标数量不相等;因此符合要求的小目标区域数量也不相等;为方便表述,设最终剩下的包含物体概率高于设定阈值的提名区域个数为n;
接下来,这n个提名区域为具有不同比例、不同大小且尺寸小于设定值的区域,使用兴趣区域池化算法将提名区域范围转化为同样大小14*14的特征区域,以进行后续计算;兴趣区域池化计算将提名区域在融合特征图上的边界范围限定的区域划分固定大小,即14*14的块,然后在每个块里分别取最大值,即将每个提名区域都转化成了相同大小的特征区域,得到n个14*14的特征图;
再将n个14*14的特征图转换为n*196大小的特征向量,传入两层全连接层提取特征,每层的神经元数量为4096个,同样的,每层全连接层后接一层线性校正单元激活函数激活;为减少计算参数数量,每层全连接层都后接一层随机失活层,即随机选取一些神经元数值为0;因此对于一个提名区域就得到一个4096维的特征向量,即总共将得到n个4096维向量;
将上一步得到的n个4096维特征向量传入一层包含21个神经元的全连接层,得到的输出将是n*21维的向量,每个21维向量即表示这个提名区域中包含的物体分别属于21类的概率;这里的21的意义是在训练时使用的Pascal Voc数据库中标记的物体类别有20类,如果提名区域中的物体未在标记类别中,也要输出一个概率,表示未知类别;这个21的值能够根据训练数据库进行更改,如果训练数据库中标记有1000类物体,则设置成有1001个神经元即可;至此,得到了前面产生的每个包含物体的提名区域内所包含具体物体的概率,取概率最大的值即为该提名区域内所包含物体的类别;
将上上一步得到的n个4096维特征向量传入一层包含84个神经元的全连接层,得到的输出将是n*84维的向量;每个84维向量表示该提名区域内包含21类物体的精修的物体边界范围,4个值能够确定一个物体在图像上的范围,使用的位置值表示为一个边界范围的中心点坐标(x_center,y_center),以及该边界范围的长和宽,在上一步得到的提名区域内包含的物体概率即21维概率与此步中得到物体边界范围即84维向量有着对应关系,即一个物体概率对应84维向量中的4个连续的值,将提名区域内包含物体概率最大的索引乘以4,以这个数在84维向量作为索引中取连续的4个值即为该提名区域所包含物体精修过的边界范围;至此,就得到了输入图像中所包含的小目标类别,以及小目标在图像中的边界范围。
2.根据权利要求1所述的一种基于区域提名的小目标检测方法,其特征在于,在步骤1)中,图像预处理,将输入图像转换为统一大小,具体如下:
输入的图像均为RGB颜色标准保存的图像,即每张图像有3个颜色通道,因此每张图像文件在计算机中的表示均为一个数字矩阵,这个矩阵的维度为图像的宽*高*3,这个矩阵中的每个值均为0~255中间的一个整数值;在使用中,能够进行任何分辨率大小的图像的小目标检测,但将图像传给神经网络进行检测时,需将所要检测的图像转换为统一的大小448*448*3,以便后续作为神经网络的输入;对于分辨率小于设定值的图像,使用双线性插值算法将图像分辨率放大至448*448;对于分辨率大于设定值的图像,同样使用双线性插值算法将图像分辨率缩小至448*448;因此,经过图像预处理后,所要进行检测的图像的分辨率均统一为448*448。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810456924.0/1.html,转载请声明来源钻瓜专利网。