[发明专利]一种基于PyTorch的行人检测方法在审
申请号: | 202111589572.4 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114359960A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 胡秋霞;田杰;薛杉;王鑫 | 申请(专利权)人: | 西安航空学院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06K9/62;G06V10/40;G06V10/80 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pytorch 行人 检测 方法 | ||
1.一种基于PyTorch的行人检测方法,其特征在于,包括:
S1、输入N张行人图像;
S2、对所述N张行人图像进行预处理;
S3、分别对预处理后的每张图像进行特征提取,获得每张图像对应的多个特征图信息;
S4、对所述多个特征图信息进行特征融合;
S5、对融合后的特征图信息进行预测框回归处理,并筛选出最优预测框;
S6、输出带有最优预测框的图像。
2.如权利要求1所述的一种基于PyTorch的行人检测方法,其特征在于,所述S2具体包括:
S21、对所述N张行人图像进行Mosaic数据增强处理;
S22、分别对所述增强处理后的图像进行自适应图像缩放,使每张图像的长度值和宽度值趋近2n。
3.如权利要求2所述的一种基于PyTorch的行人检测方法,其特征在于,所述S3具体包括:
S31、对所述预处理后的每张图像进行Focus切片处理;
S32、通过CSPDarknet53网络分别对切片处理后的图像进行特征提取,获得每张图像对应的多个特征图信息。
4.如权利要求1所述的一种基于PyTorch的行人检测方法,其特征在于,所述S4具体包括:
S41、通过FPN网络构建具有多个尺度的特征金字塔;
S42、根据所述特征金字塔对所述多个特征图信息进行特征融合。
5.如权利要求1所述的一种基于PyTorch的行人检测方法,其特征在于,所述S5具体包括:
S51、根据目标内容对对融合后的特征图信息进行预测框回归处理,获得多个预测框;
S52、通过非极大值抑制法筛选出所述最优预测框。
6.如权利要求5所述的一种基于PyTorch的行人检测方法,其特征在于,所述S52具体包括:
S521、通过GIOU_Loss函数分别计算出所述多个预测框对应的置信度;
S522、将置信度最高的预测框记录到最终输出列表中,并将所述置信度最高的预测框从预测框列表中删除;
S523、计算所述预测框列表中剩余预测框的面积;并根据所述剩余预测框的面积,计算所述置信度最高的预测框与剩余预测框的阈值;
S524、将所述剩余预测框中大于阈值的预测框,从所述预测框列表中删除;
S525、重复步骤S521-S524,直到所述预测框列表为空。
7.如权利要求1所述的一种基于PyTorch的行人检测方法,其特征在于,所述S6具体包括:通过Open CV将带有最优预测框的图像绘制到操作界面的结果输出框内进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安航空学院,未经西安航空学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111589572.4/1.html,转载请声明来源钻瓜专利网。