[发明专利]一种驾驶场景的多任务属性识别方法、装置、介质及设备在审
申请号: | 202010662803.9 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111860253A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 顾一新 | 申请(专利权)人: | 东莞正扬电子机械有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 523750 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 驾驶 场景 任务 属性 识别 方法 装置 介质 设备 | ||
1.一种驾驶场景的多任务属性识别方法,其特征在于,该方法包括:
获取驾驶场景中驾驶员的图像数据;
将所述图像数据输入至预先训练好的多任务网络模型中进行属性识别;所述多任务网络模型的属性识别任务包括:口罩识别、眼镜识别、抽烟识别和打电话识别;
根据所述多任务网络模型的属性识别输出结果,确定驾驶员的多任务属性识别结果。
2.根据权利要求1所述的方法,其特征在于,将所述图像数据输入至训练好的多任务网络模型中进行属性识别,包括:
对所述图像数据进行预处理;
将预处理后的图像数据输入至预先训练好的多任务网络模型中进行属性识别,得到多任务网络模型对是否戴口罩,是否戴眼镜,是否抽烟以及是否打电话的目标任务的属性识别结果;
缓存对目标任务的属性识别结果;
在缓存了特定时长的属性识别结果后,根据判定比例对缓存的属性识别结果判断目标任务的属性是否存在;若是,则确定样本图像的目标任务属性。
3.根据权利要求2所述的方法,其特征在于,对所述图像数据进行预处理,包括:
获取样本图像,确定样本图像中人脸的编码特征;
根据所述编码特征利用人脸识别模型确定驾驶人员的人脸框;
根据所述驾驶人员的人脸框,进行调整,再对驾驶人员的人脸裁剪,得到裁剪图像,最后归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述多任务网络模型的训练,包括:
将预处理后的图像数据输入至多任务主网络得到特征图,采用OSEM模块分别提取针对不同属性识别任务的特征图,分别输入至各自的属性识别模块中,所述属性识别模块分别为是否戴口罩属性识别模块、是否戴眼镜属性识别模块、是否抽烟属性识别模块、是否打电话属性识别模块;
整个网络的输出为每个任务的特征图、每个任务的属性识别结果,各个任务的属性识别的输出结果分别为是否戴口罩,是否戴眼镜,是否抽烟,是否打电话;
将属性识别结果与标注结果相比较,通过相应的损失函数减少其差异,并将各个任务的特征图输入到相应的损失函数中,优化网络参数;
调整损失函数的权重,以优化对多任务网络模型的训练结果和减少训练时间。
5.根据权利要求4所述的方法,其特征在于,在多任务网络模型的训练之前,所述方法还包括:
对样本图像数据标注多任务属性;
确定所述多任务网络模型的初始架构;
确定损失函数。
6.根据权利要求4所述的方法,其特征在于,是否戴口罩,是否抽烟以及是否打电话的属性识别任务的输出类别数均为两种类别;
是否戴眼镜的属性识别任务的输出类别数包括:佩戴红外阻断眼镜、佩戴普通眼镜以及不佩戴眼镜三种类别。
7.根据权利要求4所述的方法,其特征在于,对于是否戴口罩及是否戴眼镜属性识别模块,每个模块分别用于属性识别输出是否戴口罩,是否戴眼镜的结果。
8.根据权利要求4所述的方法,其特征在于,对于是否抽烟以及是否打电话属性识别模块,每个识别模块包括主体识别模块和注意力模块;
所述主体识别模块用于属性识别输出是否抽烟、是否打电话的结果;
所述注意力模块包括注意力建议子网络与注意力网络,用于属性识别及优化主体网络的属性识别结果。
9.根据权利要求8所述的方法,其特征在于,所述注意力建议子网络主要包括两个串联的全连接层,用于输出注意力区域的中心点坐标,以及注意力区域的边长,以执行对原始输入图像的裁剪和放大处理。
10.根据权利要求8所述的方法,其特征在于,所述注意力网络将裁剪和放大处理的图像经过网络分析,输出新的是否抽烟、是否打电话的结果,也可以根据需要再次裁剪和放大图像,进行网络分析,输出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞正扬电子机械有限公司,未经东莞正扬电子机械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662803.9/1.html,转载请声明来源钻瓜专利网。