[发明专利]一种针对复杂场景的行人检测方法有效
申请号: | 201811349816.X | 申请日: | 2018-11-14 |
公开(公告)号: | CN109508675B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 赵清利;梁添才;金晓峰;徐天适 | 申请(专利权)人: | 广州广电银通金融电子科技有限公司;广州广电运通金融电子股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 复杂 场景 行人 检测 方法 | ||
1.一种针对复杂场景的行人检测方法,其特征在于,行人检测方法以由拍摄图像和视频截图组成的数据集所划分的训练图像和测试图像分别作为训练数据和测试数据,将场景复杂的测试图像中的行人检测出来,并给出行人坐标框及其对应的置信度,包括以下步骤:
S1、搭建SSD目标检测模型,所搭建的SSD目标检测模型包括依次连接的前置基础网络、特征提取网络和分类检测模块;
S2、修改前置基础网络,修改特征提取网络中的前两层特征提取层,提高SSD目标检测模型的特征提取能力;
S3、添加Inception组件,并修改所添加的Inception组件,提高SSD目标检测模型的多尺度适应性;
S4、设置相应的训练参数,训练SSD目标检测模型,当SSD目标检测模型达到拟合或者到达最大训练迭代次数时停止训练并保存训练好的模型文件;
S5、设定相应的测试参数,根据训练好的SSD目标检测模型读取测试数据进行测试,输出并保存测试结果;
步骤S2修改前置基础网络时,删除SSD目标检测模型的前置基础网络中的前四组卷积组,新建四组Dense Block并串联形成DenseNet,将DenseNet添加进SSD模型的前置基础网络,替代所删除的前四组卷积组;
步骤S3在每组Dense Block的Concat层后端添加Inception组件,对Dense Block的输出特征进行卷积操作;在Inception组件的每层卷积层后端添加Batch Normalization层,并在Inception组件的前端添加一层卷积层,在Inception组件的Concat层后端添加一层卷积层,形成Inception组件的最终输出特征;在Inception组件的输出特征后端分别添加池化层,对Inception组件的输出特征进行池化操作。
2.根据权利要求1所述的行人检测方法,其特征在于,四组Dense Block所包含的3x3卷积层数量分别为2、4、8、16,且每层卷积层的输出特征维度为32。
3.根据权利要求1所述的行人检测方法,其特征在于,步骤S2修改特征提取网络中的前两层特征提取层时,删除SSD目标检测模型的特征提取网络中的前两层特征提取层,新建两组Dense Block分别替代所删除的两层特征提取层,保留特征提取网络中的后三层特征提取层,使其与新添加的两组Dense Block形成新的特征提取网络。
4.根据权利要求3所述的行人检测方法,其特征在于,添加的两组Dense Block所包含的3x3卷积层数量为8。
5.根据权利要求1所述的行人检测方法,其特征在于,在添加Inception组件过程中,通过Concatenation操作将卷积核大小分别为5x5、3x3、1x1的三层并联卷积层进行融合,组成Inception组件,其中卷积核大小分别为5x5、3x3、1x1的三层并联卷积层的卷积核个数比为1:2:1,且卷积核大小为5x5的卷积层由两层卷积核大小为3x3的卷积层串联实现;将上述Inception组件作为尺度转换模块添加至每组Dense Block后端。
6.根据权利要求1所述的行人检测方法,其特征在于,在修改所添加的Inception组件过程中,Inception组件前端所添加的卷积层的输出维度为输入特征维度的一半,且Inception组件融合特征层后端所添加的卷积层的输出维度等于卷积核大小分别为5x5、3x3、1x1的三层并联卷积层的卷积核个数之和。
7.根据权利要求1所述的行人检测方法,其特征在于,步骤S5所述的测试参数包括IOU交并比阈值、置信度阈值、非极大值抑制阈值。
8.根据权利要求1所述的行人检测方法,其特征在于,步骤S1基于Caffe深度学习框架搭建SSD目标检测模型,修改SSD目标检测模型中的分类参数,将其由21分类模型修改为二分类模型,使其适用于行人检测,构建Caffe版的SSD行人检测框架。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州广电银通金融电子科技有限公司;广州广电运通金融电子股份有限公司,未经广州广电银通金融电子科技有限公司;广州广电运通金融电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811349816.X/1.html,转载请声明来源钻瓜专利网。