[发明专利]一种加强SSD小目标行人检测性能的网络结构及检测方法有效
申请号: | 201811474112.5 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109800628B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 胡永健;陈奇华;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/40;G06V20/52;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加强 ssd 目标 行人 检测 性能 网络 结构 方法 | ||
1.一种加强SSD小目标行人检测性能的网络结构,其特征在于,包括:
预处理模块,用于统一样本尺寸和样本扩增,所述样本为用于小目标行人检测的训练样本集;
基础网络模块,用于提取样本的浅层特征;
所述基础网络模块采用VGG16内置网络,其Conv4_3作为浅层特征提取层;
附加特征提取模块,其Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2作为深层特征提取层;
两级特征融合模块,用于将Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2的特征信息融合到Conv4_3中;
第一级融合,先将Conv4_3经过3×3卷积并以ReLU方式激活,再将Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2分别经过3×3卷积、ReLU方式激活以及双线性插值操作,使其与Conv4_3尺度一致;然后将经过卷积、激活和插值操作的五个特征提取层分别与经过卷积、激活操作的Conv4_3按照Eltwise-SUM方式融合在一起,即将特征图对应位置单元进行相加,得到五个融合层;最后,将每一个融合层再次以ReLU方式激活,并进行BatchNorm操作,得到五个融合特征层;
第二级融合,将所得的五个融合特征层按照Eltwise-SUM方式融合,即将每个特征图对应位置单元进行相加,得到新的融合层,然后再将新融合层以ReLU方式激活,并进行BatchNorm操作,得到最终的两级特征融合层;
附加特征提取模块,用于提取样本的深层特征;
两级特征融合模块,用于将深层特征与浅层特征融合;
分类和回归模块,用于计算损失,实现分类和行人框的回归;
计算损失并反向传播,进行网络参数的迭代更新,迭代更新过程中,将两级特征融合层和Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2送入分类和回归模块,计算损失,分类和回归模块中总的损失为分类损失和回归损失的加权和;利用优化方法将损失进行反向传播,所述优化方法为随机梯度下降法,更新基础网络模块、附加特征提取模块和两级特征融合模块中的网络系数,即各神经元之间的连接权重以及偏置,经过初始化中确定的迭代次数后完成网络训练;
由分类和回归模块对最终的多尺度特征提取层进行分类和行人框的回归。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811474112.5/1.html,转载请声明来源钻瓜专利网。