[发明专利]一种基于改进型SSD网络的车辆行人多目标检测方法在审
申请号: | 201811174964.2 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109409252A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 陈龙;朱玉刚;樊凌雁;杨柳;郑雪峰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 陆永强 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进型SSD网络的车辆行人多目标检测方法,步骤S1:将通过行车记录仪采集的海量行车视频,制作为合适大小的图片输入集;步骤S2:根据k‑means聚类方法得到的分布数据修改SSD网络中锚框的尺寸和长宽比,使其适合本数据集;步骤S3:使用Focal Loss函数替换原有的损失函数,取代了了原有的在线选择难分样本(Online Hard Example Mining,OHEM)机制,解决了正负样本失衡的问题;步骤S4:输入数据集,训练新的SSD网络;步骤S5:使用经过训练的SSD网络对实时输入的图片进行目标检测。采用本发明的技术方案,通过聚类的方法,设定建议锚框的尺寸和长宽比,使之分布与标注框分布相似,从而加快了训练收敛速度,提升了检测的准确率,再通过Focal Loss函数,解决正负样本失衡问题,加大难分样本的重视度,减少了内存的占用,提高了训练速度,同时也提升了整体检测的准确率。 | ||
搜索关键词: | 多目标检测 正负样本 网络 长宽比 改进型 原有的 准确率 聚类 锚框 样本 失衡 输入数据集 行车记录仪 分布数据 函数替换 目标检测 损失函数 图片输入 训练收敛 在线选择 整体检测 标注框 数据集 内存 视频 行车 采集 占用 检测 制作 图片 | ||
【主权项】:
1.一种基于改进型SSD网络的车辆行人多目标检测方法,其特征在于,包括以下步骤:步骤S1:将通过行车记录仪采集的海量行车视频,制作为合适大小的图片输入集;步骤S2:根据k‑means聚类方法得到的分布数据修改SSD网络中锚框的尺寸和长宽比,使其适合本数据集;步骤S3:使用Focal Loss函数替换原有的损失函数选择样本;步骤S4:输入数据集,训练新的SSD网络;步骤S5:使用经过训练的SSD网络对实时输入的图片进行目标检测;其中,步骤S1进一步包括:步骤S11:将视频每隔3秒提取一帧并存储;步骤S12:得到的图片分辨率为3000*2000,剪切为2000*1500大小;;步骤S13:对得到的图片数据集进行标注,标注信息存入Label数据库里,作为标签;所述步骤S2进一步包括:步骤S21:统计标注信息里各个标签目标框的长宽尺寸,分别记为W,H,画出各个目标框长宽W_H分布图,其中W为横坐标,H为纵坐标;;步骤S22:在每个分布比较集中的的区域中选择一个中心附近的点作为该区域的中心,假设选择k个中心构成集合为WHS={(w1,h1),(w2,h2)…(wk,hk)};步骤S23:计算每个点到每个聚类中心的欧式距离,距离哪个聚类中心近,就让该点属于哪个点群,得到其属于的点群;X={x1,x2…xn}是所用的样本点,其对应的长宽分别为w={wx1,wx2...wxn},h={hx1,hx2...hxn}计算聚类的公式如下:
其中dij表示,第i个样本到第j个聚类中心的距离;步骤S24:更新每个点所属的点群后,重新计算每个点群的中心,点群j中每个点的W的集合为w={wj1,wj2...wjm},H的集合为h={hj1,hj2...hjm},那么点群j新的聚类中心的坐标分别为:![]()
步骤S25:重复步骤S23,步骤S24,直到聚类中心不再变化;便得到k个聚类中心;步骤S26:根据聚类得出的聚类中心,设定锚框的长宽尺寸和长宽比;所述步骤S3进一步包括:步骤S31:设置Focal Loss需要的参数α,γ;步骤S32:删除原有的OHEM机制;步骤S33:替换原有的损失函数;所述步骤S4进一步包括:步骤S41:初始化修改后的网络;步骤S42:分别从数据库里获取训练图片和对应的标签,输入网络;步骤S43:Softmax函数输出的置信度pi如下:
其中D(i)为上一层的输入;计算Pi对D(j)的偏导数:当i等于j时:
当i不等于j时:
通过最小化置信度损失函数,来更新参数,其中设置的置信度损失函数如下:
其中Pos为正样本,Neg为负样本;步骤S44:计算新引入的损失函数的梯度,
其中
已经在步骤S43里求得;综上得,当样本属于负样本时对应新的损失函数的梯度为:![]()
通过最小化位置损失函数,来更新参数,其中位置损失函数如下:![]()
![]()
其中,
是真实值和区域候选框之间在(x,y,w,h)四个维度下的相对偏移量,l代表预测的偏移量,d代表区域候选框;当
时,表示第i个区域候选框和第j个标签值匹配,且标签所属类别是k,反之,其为零;步骤S45:将新的损失函数的梯度替换原损失函数的梯度,根据链式求导法则以及小批量梯度下降法,进行反向传播,更新参数步骤S46:训练结束,输出模型;步骤S5进一步包括:步骤S51:去除最后的损失函数层;步骤S52:输入测试数据,得到目标输入每个类别的置信度,以及四个回归量;步骤S53:根据回归量,修改锚框对应的变量,得到检测框。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811174964.2/,转载请声明来源钻瓜专利网。
- 上一篇:虚拟和增强现实系统和方法
- 下一篇:一种基于图像识别技术的故障检测系统