[发明专利]行人检测方法与装置有效
申请号: | 201811074285.8 | 申请日: | 2018-09-14 |
公开(公告)号: | CN110909564B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 马海军;王鹏;田文善;秦暕;葛逸盛 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 徐海晟;刘芳 |
地址: | 100094*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 检测 方法 装置 | ||
1.一种行人检测方法,其特征在于,包括:
获取待检测图像;所述待检测图像为车载设备采集到的需检测其中行人的图像;
对所述待检测图像依次执行至少一次第一卷积处理,每次第一卷积处理均得到一个第一图像,其中,除第一次第一卷积处理以外,每次第一卷积处理均是对上一次第一卷积处理之后得到的第一图像执行的;
对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,其中,除第一次反卷积处理以外,每次反卷积处理均是对上一次反卷积处理之后确定的第三图像执行的;
根据所确定的最后一个第三图像,利用第一卷积神经网络确定所述待检测图像中行人的标识信息;所述标识信息包括标识框单元信息,所述标识框单元信息,用于描述特定像素点对应的标识框单元,所述标识框单元信息包括与该标识框单元对应的特定像素点距离该标识框单元的每条边的距离;所述特定像素点为所述行人在所述待检测图像中的像素点;
根据所述行人的标识信息,对所述行人执行标识;
该方法还包括:训练所述第一卷积神经网络;
所述训练所述第一卷积神经网络,包括:
通过所述第一卷积神经网络的输入层接收训练图像以及对应的标识信息;
各中间层针对所述训练图像实施对特征的映射得到标识信息,将所得到的标识信息与输入层接收的标识信息进行比对,评估差距,调整各中间层的映射规则,使得所述第一卷积神经网络输出的结果与输入层接收的标识信息接近。
2.根据权利要求1所述的方法,其特征在于,所述根据每次反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像;
将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;
对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像。
3.根据权利要求1所述的方法,其特征在于,所述第一卷积处理中对图像的采样方式是经第一素材集合与第二素材集合依次训练后确定的,所述反卷积处理中对图像的采样方式是经所述第二素材集合训练后确定的。
4.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像依次执行至少一次第一卷积处理,包括:利用第一卷积神经网络的卷积模块执行所述第一卷积处理;
所述对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:
利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,并在每次反卷积处理后,均根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像。
5.根据权利要求4所述的方法,其特征在于,所述对所述待检测图像依次执行至少一次第一卷积处理之前,还包括:
确定所述卷积模块已在另一第二卷积神经网络中经第一素材集合训练过;
利用第二素材集合训练所述第一卷积神经网络;
所述第二卷积神经网络是采用ResNet网络架构的开源神经网络,所述卷积模块采用ResNet50的整体卷积结构。
6.根据权利要求4或5所述的行人检测方法,其特征在于,所述利用第一卷积神经网络的卷积模块执行所述第一卷积处理,包括:利用所述卷积模块中的第一卷积层执行所述第一卷积处理;
所述利用第一卷积神经网络的反卷积模块对所得到的最后一个第一图像执行至少一次反卷积处理,包括:利用所述反卷积模块的反卷积层执行所述反卷积处理;
所述根据所述反卷积处理得到的第二图像,以及与所述第二图像尺寸相同的第一图像,确定一个第三图像,包括:利用所述第一卷积神经网络将与所述第二图像尺寸相同的第一图像与所述第二图像连接,得到连接后图像;利用所述反卷积模块对所述连接后图像依次执行至少一次第二卷积处理,得到所述第三图像,其中每次第二卷积处理均是利用所述反卷积模块中的一个第二卷积层执行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811074285.8/1.html,转载请声明来源钻瓜专利网。