[发明专利]一种眼睛属性分类方法、装置及存储介质有效
申请号: | 202111479846.4 | 申请日: | 2021-12-07 |
公开(公告)号: | CN113903074B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 何卓楠;刘国清;王启程;杨广;徐子健 | 申请(专利权)人: | 深圳佑驾创新科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V40/18;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;许羽冬 |
地址: | 518051 广东省深圳市福田区梅林街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 眼睛 属性 分类 方法 装置 存储 介质 | ||
本发明公开了一种眼睛属性分类方法、装置及存储介质,包括:获取眼部图像;获取对眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;将训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;将待分类眼部图像输入至眼睛属性分类模型中,输出眼睛属性分类模型中三个级联分类器的分类结果。本发明实施例不仅能够保证眼睛属性判断的准确性,还能够有效适用于复杂场景。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种眼睛属性分类方法、装置及存储介质。
背景技术
眼睛属性分类在智能座舱中对驾驶员的状态分析起着重要的作用,可以用于疲劳驾驶判断,包括眼睛睁闭识别,辅助表情识别和视线估计。目前,现有眼睛属性分类方法通常为基于几何先验和特征定位的方式来进行眼睛属性分类,但是现有的眼睛属性分类方法难以适用于真实环境中的复杂情况,眼睛属性分类的结果较差。
发明内容
本发明提供了一种眼睛属性分类方法、装置及存储介质,以解决现有的眼睛属性分类方法无法是适用于真实环境中复杂的情况,导致眼睛属性分类的结果较差的技术问题。
本发明的一个实施例提供了一种眼睛属性分类方法,包括:
获取眼部图像;
获取对所述眼部图像进行标注得到的四类标注数据,并将预设比例的四类标注作为训练数据集,所述四类标注数据包括:无眼睛图像、闭眼图像、瞳孔可见图像和瞳孔不可见图像;
将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型;
将待分类眼部图像输入至所述眼睛属性分类模型中,输出所述眼睛属性分类模型中三个级联分类器的分类结果,所述三个级联分类器包括第一分类器、第二分类器和第三分类器,第一分类器用于判断所述待分类眼部图像中是否存在眼睛,所述第二分类器用于判断所述待分类图像中眼睛是否睁开,所述第三分类器用于判断瞳孔是否可见。
进一步的,所述获取眼部图像,包括:
采集目标图像,利用人脸检测算法检测目标图像中是否存在人脸,若存在人脸则截取所述目标图像中的头部图像,采用关键点检测算法得到所述头部图像的关键信息,并从所述关键点信息位置截取得到所述目标图像中的眼部图像。
进一步的,获取对所述眼部图像进行标注得到的四类标注数据,包括:
判断所述眼部图像中是否存在眼睛图像,若不存在眼睛图像,则标注为无眼睛图像;
若存在眼睛图像,判断所述眼睛图像的上下眼睑是否闭合,若是则标注为闭眼图像;
若所述眼睛图像的上下眼睑不闭合,则判断所述眼睛图像中的瞳孔是否可见,在所述瞳孔可见时标注为瞳孔可见图像,在所述瞳孔为不可见时标注为瞳孔不可见图像。
进一步的,将所述训练数据集输入至预先设计好的神经网络结构进行模型分类训练,得到眼睛属性分类模型,包括:
将训练数据集进行数据增强处理后得到预处理数据,将所述预处理数据输入至预先设计好的神经网络结构中,采用交叉熵作为损失函数进行模型分类训练,得到眼睛属性分类模型。
进一步的,所述数据增强处理包括但不限于水平翻转、随机旋转、对比度拉伸、随机高斯噪声、图像亮度变换、图像gamma值调整的至少一种。
进一步的,所述损失函数的表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳佑驾创新科技有限公司,未经深圳佑驾创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111479846.4/2.html,转载请声明来源钻瓜专利网。