[发明专利]一种基于深度学习的道路救援装备正方位拖牵诱导方法有效
申请号: | 201910432687.9 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110298247B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李旭;曹继文;徐启敏;王培宇 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V20/58;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 唐红 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 道路 救援 装备 方位 诱导 方法 | ||
1.一种基于深度学习的道路救援装备正方位拖牵诱导方法,其特征在于:依次包括以下步骤:
(1)基于改进tiny-yolo设计车牌识别网络,具体过程如下:
(1.1)设计膨胀卷积层:在所采集的图像中,车牌是图像的小尺度目标,车头是图像的大尺度目标,鉴于这种车牌与车头的关系,在网络的浅层采用膨胀卷积方法;
(1.2)设计NIN卷积层:基于NIN思想将1×1的卷积层置于两个相邻的3×3的卷积层之间;
(1.3)设计分解卷积层:采用卷积核分解的方法进行深层网络设计,将3×3卷积层分解为3×1卷积层和1×3卷积层;
(1.4)确定网络整体架构,即基于局部优化设计对tiny-yolo网络进行改进,确定最终的整体网络架构:整个网络共有19层,包含个14个卷积层和5个池化层;
其中,网络的第1、3、5、9、15层为池化层,池化域均为2×2,步长均为2;网络的第2、4层为膨胀卷积层,膨胀率分别为2、4,卷积核大小为3×3,对应卷积核的数量为32、64,步长为1;网络的第0、6、8层为标准卷积层,卷积核大小为3×3,对应卷积核数量分别为16、128、128,步长为1;网络的第7、12层为NIN卷积层,卷积核大小为1×1,对应卷积核数量分别为64、128,步长为1;网络的第10和11、13和14、16和17层为分解卷积层,卷积核的大小分别为3×1、1×3、3×1、1×3、3×1、1×3,对应卷积核的数量分别为256、256、256、256、512、512,步长均为1;最后一层卷积层的卷积核大小为1×1,卷积核数量为18,步长为1;
(2)基于步骤(1)的车牌识别网络进行网络模型训练
在室外模拟道路救援装备正方位拖牵作业过程,采集包含被拖车辆的后方作业图像,制作样本集,然后采用多尺度训练策略;
其中多尺度训练策略的具体内容为:在迭代过程中,每隔固定批次,从设定的多尺度集中重新更换一个尺度对基于改进tiny-yolo的车牌识别网络进行训练,获得网络参数;
(3)车牌识别
使用基于改进tiny-yolo的车牌识别网络对道路救援装备后方作业区域图像中的被拖车车牌进行初始化识别,进而确定车牌相关参数:图像中被拖车车牌中心像素横坐标x0;车牌像素长度l0;
(4)正方位拖牵横向偏差测量
(4.1)判断道路救援装备与被拖车的相对位置关系:即根据摄像机采集图像的中心与图像中被拖车车牌中心的左右位置关系判断道路救援装备与被拖车的相对位置关系:若被拖车车牌中心在图像中心左侧,则被拖车偏向道路救援装备拖牵装置左侧;若被拖车车牌中心在图像中心右侧,则被拖车偏向道路救援装备拖牵装置右侧;
(4.2)横向偏差计算:在摄像头的采集图像中,道路救援装备拖牵装置的左右中心线与图像的水平中心线一致,因此道路救援装备拖牵装置与被拖车位置之间的横向偏差距离计算公式为:
ΔC0=|x0-X|×L0/l0
式中,ΔC0为道路救援装备与被拖车位置之间的横向偏差距离,x0为车牌识别得到的车牌中心像素横坐标,l0为车牌识别得到的车牌像素长度,X为摄像头采集图像中心横坐标,L0为车牌字符实际长度。
2.根据权利要求1所述的基于深度学习的道路救援装备正方位拖牵诱导方法,其特征在于:所述步骤(1.3)中设计后的车牌识别网络共有19层,具体网络结构表述如下:
第0层即标准卷积层0:用16个3×3的卷积核与416×416×3像素的输入样本做卷积,步长为1,得到维度为416×416×16的特征图;
第1层即池化层0:用2×2的核对第0层输出的特征图做最大池化,步长为2,得到维度为208×208×16的特征图;
第2层即膨胀卷积层0:用32个3×3的卷积核与第1层输出的特征图做卷积,步长为1,膨胀率为2,得到维度为208×208×32的特征图;
第3层即池化层1:用2×2的核对第2层输出的特征图做最大池化,步长为2,得到维度为104×104×32的特征图;
第4层即膨胀卷积层1:用64个3×3的卷积核与第3层输出的特征图做卷积,步长为1,膨胀率为4,得到维度为104×104×64的特征图;
第5层即池化层2:用2×2的核对第4层输出的特征图做最大池化,步长为2,得到维度为52×52×64的特征图;
第6层即标准卷积层1:用128个3×3的卷积核与第5层输出的特征图做卷积,步长为1,得到维度为52×52×128的特征图;
第7层即NIN卷积层0:用64个1×1的卷积核与第6层输出的特征图做卷积,步长为1,得到维度为52×52×64的特征图;
第8层即标准卷积层2:用128个3×3的卷积核与第7层输出的特征图做卷积,步长为1,得到维度为52×52×128的特征图;
第9层即池化层3:用2×2的核对第8层输出的特征图做最大池化,步长为2,得到维度为26×26×128的特征图;
第10层即分解卷积层0:用256个3×1的卷积核与第9层输出的特征图做卷积,步长为1,得到维度为26×26×256的特征图;
第11层即分解卷积层1:用256个1×3的卷积核与第10层输出的特征图做卷积,步长为1,得到维度为26×26×256的特征图;
第12层即NIN卷积层1:用128个1×1的卷积核与第11层输出的特征图做卷积,步长为1,得到维度为26×26×128的特征图;
第13层即分解卷积层2:用256个3×1的卷积核与第12层输出的特征图做卷积,步长为1,得到维度为26×26×256的特征图;
第14层即分解卷积层3:用256个1×3的卷积核与第13层输出的特征图做卷积,步长为1,得到维度为26×26×256的特征图;
第15层即池化层4:用2×2的核对第14层输出的特征图做最大池化,步长为2,得到维度为13×13×256的特征图;
第16层即分解卷积层4:用512个3×1的卷积核与第15层输出的特征图做卷积,步长为1,得到维度为13×13×512的特征图;
第17层即分解卷积层5:用512个1×3的卷积核与第16层输出的特征图做卷积,步长为1,得到维度为13×13×512的特征图;
第18层:用18个1×1的卷积核与第17层输出的特征图做卷积,步长为1,得到维度为13×13×18的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910432687.9/1.html,转载请声明来源钻瓜专利网。