[发明专利]一种驾驶环境下手部区域的检测方法有效
申请号: | 201910378179.7 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110110665B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 林相波;史明明;李一博;戴佐俊 | 申请(专利权)人: | 北京创源微致软件有限公司;大连理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 驾驶 环境 下手 区域 检测 方法 | ||
1.一种驾驶环境下手部区域的检测方法,其特征在于,具体包括如下步骤:
步骤1)准备数据集,该数据集在真实驾驶环境中通过安装在驾驶室不同位置处的相机设备拍摄驾驶室内景况下获取,并将数据集分为训练图像集和测试图像集,然后对数据集进行数据扩充,之后生成新的手部包围框
步骤2)构建手部检测卷积神经网络结构,采用多尺度架构,利用不同尺度上的特征信息,完成特征提取并融合;
步骤3)采用ADAM优化算法端到端训练,从训练图像集中随机采样,当损失函数L稳定后停止训练;
该损失函数L公式如下:
L=Lc+Lr (1)
其中Lc用来评价手部包围框内外像素是否正确分类的概率,Lr用来评价手部包围框顶点位置是否得到正确回归;
Lc=-αp*(1-p)γlogp-(1-α)(1-p*)pγlog(1-p) (2)
其中p*表示真实的像素分类结果,p表示网络估计的像素位于手部包围框内的概率,α是正负样本平衡因子,γ根据经验取值;
其中Ci和分别表示手部包围框坐标的回归结果和真实值;
步骤4)采用非极大值抑制用来消除冗余的候选框,得到最佳的手部包围框;
步骤5)公布检测结果。
2.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤1)中所述训练图像集按照9:1比例随机分为训练子集、验证子集。
3.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤1)中对数据集的数据扩充方法包括水平翻转、垂直翻转、随机角度旋转、平移、高斯模糊和锐化,扩充后训练数据增加到至少22000幅图像。
4.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤1)中数据扩充包含以下规则:
扩充规则1:亮度增强范围1.2–1.5倍,缩放比例0.7–1.5倍,x方向平移40像素,y方向平移60像素;
扩充规则2:随机裁剪边距0-16像素,按50%概率水平翻转;
扩充规则3:100%垂直翻转,加入均值为0,方差为3的高斯模糊处理;
扩充规则4:随机旋转,旋转角度上限45°,加入高斯白噪声,噪声水平20%,按50%概率随机锐化。
5.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤1)中新的手部包围框生成方法如下:以原有手部包围框的四条边框为基准,向框内缩进指定长度d=0.2lmin,lmin为最短边框长度,框内部分标记为1,框外部分标记为0。
6.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤2)中特征提取并融合包含三个卷积模块和一个上采样特征融合处理,具体包括如下步骤:
输入层图像尺寸256×256,第一个卷积模块ConvB_1含两个卷积层和一个最大池化层,卷积核3×3,64个通道;第二个卷积模块ConvB_2含两个卷积层和一个最大池化层,卷积核3×3,128个通道;第三个卷积模块ConvB_3含三个卷积层和一个最大池化层,卷积核3×3,256个通道;上述池化层的核尺寸均为2×2,步长为2;
将第三个卷积模块ConvB_3输出的特征图上采样,尺寸扩大一倍,再将第二个卷积模块ConvB_2输出的特征图利用Dropout机制随机去除20%的通道数,将二者级联;融合后的特征图FusF_1规范化处理后送入1×1和3×3级联卷积组ConvC_1,共128个通道;其输出再经过一个卷积核个数为32的3×3卷积层后送入输出层;输出层含两个分支,分支1通过单通道1×1卷积,预测每个像素点位于目标区域的概率;分支2通过4通道1×1卷积,预测目标包围框顶点的坐标值。
7.根据权利要求1所述的驾驶环境下手部区域的检测方法,其特征在于,步骤5)中检测结果包括如下客观量化评价指标:平均准确度AP、平均召回率AR、综合评价指标F1-score和检测速度FPS;
假设TP表示估计到了真实目标,FP表示估计到的目标不是真实目标,FN表示真实目标没有被估计到,则
FPS采用帧率描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京创源微致软件有限公司;大连理工大学,未经北京创源微致软件有限公司;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910378179.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像处理的分车道车辆检测方法
- 下一篇:目标检测方法和装置