[发明专利]融合深度感知特征和核极限学习机的行人检测方法有效
申请号: | 201810814395.7 | 申请日: | 2018-07-23 |
公开(公告)号: | CN110751005B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 孙锐;王慧慧;叶子豪;高隽 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/46;G06V10/80;G06V10/82;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 深度 感知 特征 极限 学习机 行人 检测 方法 | ||
1.一种融合深度感知特征和核极限学习机的行人检测方法,其特征是按如下步骤进行:
步骤1、从行人数据集中选取N/2个行人训练图像和N/2个非行人训练图像,并对所述N/2个行人训练图像和N/2个非行人训练图像分别进行预处理,获得N/2个行人正样本训练图像和N/2个行人负样本训练图像,由所述N/2个行人正样本训练图像和N/2个行人负样本训练图像构成N个样本训练图像;
步骤2、构建包含两部分的DAGnet神经网络
步骤2.1、构建DAGnet神经网络的第一部分结构
将所述N个样本训练图像经过第一层卷积层学习得到第一级特征图,再将所述第一级特征图分别经过第一层平均池化层和第一层block结构,得到第一池化层特征图和第一block结构特征图;将所述第一池化层特征图和第一block结构特征图进行特征融合,得到第二级特征图;所述block结构包括两层卷积层和一层平均池化层;
步骤2.2、构建DAGnet神经网络的第二部分结构
将所述第二级特征图经过第二层卷积层学习得到第三级特征图,将所述第三级特征图分别经过第二层平均池化层和第二层block结构,得到第二池化层特征图和第二block结构特征图;将所述第二池化层特征图和第二block结构特征图进行特征融合,得到第四级特征图;
步骤2.3、将所述第四级特征图经过第三层卷积层、第三层平均池化层和全连接层的学习,分别得到所述N个样本训练图像的预测标签,从而完成所述DAGnet神经网络的构造;
步骤3、利用所述N个样本训练图像对构造的DAGnet神经网络进行训练,并采用标准差为σ的正态分布随机初始化第一层卷积层的权重,且在训练过程中利用梯度下降法和BP反向传播算法对所述DAGnet神经网络的参数进行更新优化,从而得到DAGnet模型;
步骤4、利用所述DAGnet模型对所述N个样本训练图像提取第三层平均池化层的特征信息数据,从而获得所述N个样本训练 图像的深度感知特征向量;再对所述深度感知特征向量进行归一化处理,得到归一化后的深度感知特征向量;
步骤5、利用所述归一化后的深度感知特征向量和所述预测标签对核极限学习机进行训练,得到行人识别模型;
步骤6、采用K-折交叉验证的方法对所述核极限学习机进行泛化性能估计,从而确定核极限学习机的最优参数;
步骤7、对待检测的测试图像进行归一化处理,得到预处理后的测试图像,利用所述DAGnet模型获取预处理后的测试图像的第二级特征图;
步骤8、采用线性融合的方式将所述第二级特征图中的各通道的特征信息进行融合,得到新的特征图;利用GVBS显著性检测算法对所述新的特征图进行显著性检测处理,得到显著图;再根据所述新的特征图和预处理后的测试图像的空间映射比例关系,将所述显著图中的显著区域的映射到预处理后的测试图像中,从而在预处理后的测试图像中标注行人的大致区域;
步骤9、采用多尺度滑动窗口对所标注行人的大致区域进行扫描,在扫描过程中的每个滑动窗口所在区域均利用所述DAGnet模型提取相应的深度感知特征向量,从而得到窗口所在区域的深度感知特征向量;
步骤10、将所述窗口所在区域的深度感知特征向量输入所述行人识别模型中,从而得到所有含有行人的窗口所在区域;
步骤11、对所有含有行人的窗口所在区域进行筛选,从而得到所述测试图像中的行人所在位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810814395.7/1.html,转载请声明来源钻瓜专利网。