[发明专利]一种基于PyTorch的行人检测方法在审
申请号: | 202111589572.4 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114359960A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 胡秋霞;田杰;薛杉;王鑫 | 申请(专利权)人: | 西安航空学院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06K9/62;G06V10/40;G06V10/80 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pytorch 行人 检测 方法 | ||
本发明公开了一种基于PyTorch的行人检测方法;包括:输入N张行人图像;对所述N张行人图像进行预处理;分别对预处理后的每张图像用已知网络进行特征提取,获得每张图像对应的多个特征图信息;对多个特征图信息进行特征融合;对融合后的特征图信息进行预测框回归处理,并筛选出最优预测框;输出带有最优预测框的图像;通过该方法可以丰富数据集、减少GPU数量,同时提高行人检测方法的精度和速度。
技术领域
本发明属于数字图像处理技术领域,特别是一种基于PyTorch的行人检测方法。
背景技术
随着智能化不断发展,智能监控系统、车辆辅助系统、智能机器人等智能化的系统不断普及,同时行人检测的重要性逐渐体现出来,行人检测结果的准确性决定了智能设备的使用效果。当前行人检测技术在空旷无人的环境中体现出来的结果较为理想,但是在复杂拥挤的行人道路中效果较差。由于行人的动作多变,因此要想取得好的检测效果,就需要对行人检测算法的精度和速度提出更高的要求。
2021年NataprawiraJason等人使用多光谱图像和深度神经网络进行行人检测,对不同光照条件下的行人检测性能进行了评估,然后提出采用多光谱图像和深度神经网络来提高检测精度。部分研究人员使用多摄像头传感器来实现基于视觉的人员跟踪系统,提出一种新颖高效的深度学习行人检测和人类感知约束的标准化,可以较好实现交互机器人跟随行人的操作。中南大学邹逸群等人研究了Anchor-free的尺度自适应行人检测算法,Anchor作为行人检测算法中的初始框,解决了行人在移动状态下的问题并且降低行人尺度变化的问题。然而,使用Anchor需要精心调整参数,它是对检测性能影响非常大的Anchor超参数,如Anchor的尺度和高宽比等,为解决这一问题,邹逸群等人提出一种基于Anchor-free损失函数的行人检测算法,并通过融合特征金字塔网络(FPN)检测并提取分支的特征,使Anchor-free行人检测算法在训练过程中不需要为FPN的每个检测分支设置有效的训练尺度范围,另外,还提出一个尺度注意力(scale attention,SA)模块,用于融合FPN所有检测分支特征的过程,使网络在检测某个尺度的行人时,能够自适应地为行人所对应的不同尺度的感兴趣区域(ROI)特征赋予合适的权重。但是以上方法输入图像数据集有限,需要一定的GPU来辅助进行,图像缩放有一定的限制,行人检测算法的精度和速度有待提高。
因此,如何丰富数据集、减少GPU数量,同时提高行人检测方法的精度和速度,成为当前研究的关键问题。
发明内容
鉴于上述问题,本发明提供一种至少解决上述部分技术问题的一种基于PyTorch的行人检测方法,通过该方法可以丰富数据集、减少GPU数量,同时提高行人检测方法的精度和速度。
本发明实施例提供了一种基于PyTorch的行人检测方法,包括:
S1、输入N张行人图像;
S2、对所述N张行人图像进行预处理;
S3、分别对预处理后的每张图像进行特征提取,获得每张图像对应的多个特征图信息;
S4、对所述多个特征图信息进行特征融合;
S5、对融合后的特征图信息进行预测框回归处理,并筛选出最优预测框;
S6、输出带有最优预测框的图像。
进一步地,所述S2具体包括:
S21、对所述N张行人图像进行Mosaic数据增强处理;
S22、分别对所述数据增强后的图像进行自适应图像缩放,使每张图像的长度值和宽度值趋近2n。
进一步地,所述S3具体包括:
S31、对所述预处理后的每张图像进行Focus切片处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安航空学院,未经西安航空学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111589572.4/2.html,转载请声明来源钻瓜专利网。