[发明专利]基于改进特征金字塔和边界损失的道路场景行人检测方法在审
申请号: | 202210295880.4 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114782983A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 彭树生;杨举魁;吴礼;张靖桢 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/762;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 岑丹 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 特征 金字塔 边界 损失 道路 场景 行人 检测 方法 | ||
1.一种基于改进特征金字塔和边界损失的道路场景行人检测方法,其特征在于,包括如下步骤:
S1:获取道路场景的行人视频,创建训练集和测试集;
S2:采用k-means++算法对数据集进行聚类分析,得到候选框尺寸;
S3:对输入图像进行预处理;
S4:将预处理后的图像输入改进的YOLOv3检测模型进行训练,得到行人检测模型。
2.根据权利要求1所述的基于改进特征金字塔和边界损失的道路场景行人检测方法,其特征在于,采用k-means++算法对数据集进行聚类分析前筛选训练集中的有效坐标数据,具体方法为:
将训练集对应的xml文件中记录的坐标数据写入到长度为lenth的数组data_box中,起始坐标数据从data_box中保存的第一组数据开始算起,初始化数组的索引值index=0;
计算出标注框的宽度width及高度height,若width=0或height=0,则其对应的data_box中的坐标数据无效,删除这组数据,令lenth=lenth-1,并进行下一组数据的判断;若width与height都不为0,则其对应的坐标数据有效,计算宽度width与高度height的比值rate,若比值rate大于设定值,则该比值对应的坐标数据无效,令lenth=lenth-1,从data_box数组中删除并进行下一组数据的判断;若比值rate小于或等于设定值,则该比值对应的坐标数据有效,令index=index+1,重复执行之前步骤直至index=lenth,筛选出全部有效坐标数据。
3.根据权利要求2所述的基于改进特征金字塔和边界损失的道路场景行人检测方法,其特征在于,采用k-means++算法对数据集进行聚类分析,得到候选框尺寸的具体方法为:
设定9个聚类中心Z={z1,z2…,z9},定义行数等于lenth,列数等于9的二维数组data_kmeans,数组的行表示data_box中的有效坐标数据,列表示聚类中心的距离值,初始化data_kmeans中的元素为0;
计算data_box数组的数据均值,作为第一个聚类中心z_1;计算data_box中lenth组有效坐标信息与聚类中心z_1的距离,选择距离最远的8个点作为剩下的聚类中心;
计算data_box中lenth组有效坐标信息与9个聚类中心的距离,将得到的距离值写进data_kmeans数组中对应的行数和列数的位置;将data_box中每行对应的有效坐标信息分配给该行中最小距离值对应的聚类中心;完成全部坐标信息的分配,计算出每个聚类中心里成员的宽高均值,作为该聚类中心新的数值;重复执行之前的步骤,直至9个聚类中心的数值不再变化。
4.根据权利要求2所述的基于改进特征金字塔和边界损失的道路场景行人检测方法,其特征在于,采用的距离度量公式为:
d=1-IOU(box,Z)
其中,box表示有效坐标信息,IOU表示预测框和真实框的交互比,AP和AG分别表示预测框和真实框的面积,AI表示两种区域集合部分的面积,Z表示聚类中心。
5.根据权利要求1所述的基于改进特征金字塔和边界损失的道路场景行人检测方法,其特征在于,对图像进行预处理具体包括行Mosaic数据增强、hsv数据增强、自适应图片缩放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210295880.4/1.html,转载请声明来源钻瓜专利网。