[发明专利]一种睁眼闭眼状态检测方法在审
申请号: | 201810572216.3 | 申请日: | 2018-06-06 |
公开(公告)号: | CN108960071A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 刘汝帅;姚琪 | 申请(专利权)人: | 武汉幻视智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 廉海涛 |
地址: | 430000 湖北省武汉市洪山*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 闭眼状态 眼部 截取 检测 神经网络模型 人脸检测 人脸位置 坐标计算 帧图像 分类 人脸 图片 学习 | ||
本发明涉及一种睁眼闭眼状态检测方法,首先对当前帧图像进行人脸检测并获取人脸landmark的位置;利用检测到的人脸位置以及landmark坐标计算出眼部的区域,并截取眼部图片;利用预先训练好的神经网络模型进行眼部图片的分类,识别睁眼闭眼状态。本发明利用深度学习的方法,将上述截取的眼部图片进行分类训练,实现准确的区分“睁眼”和“闭眼”。
技术领域
本发明涉及人脸识别技术领域,具体涉及一种睁眼闭眼状态检测方法。
背景技术
随着人工智能技术的发展,眼睛作为人类重要的面部特征有着广泛的使用场景。例如人脸识别过程中要判断是否睁眼以避免在睡眠时误解锁的问题;判断司机是否有疲劳驾驶的行为等方面,一种可靠的判断睁眼闭眼状态的方法显得极其重要。
发明内容
本发明针对现有技术中存在的技术问题,提供一种睁眼闭眼状态检测方法,利用深度学习的方法,将上述截取的眼部图片进行分类训练,实现准确的区分“睁眼”和“闭眼”。
本发明解决上述技术问题的技术方案如下:一种睁眼闭眼状态检测方法,包括以下步骤:
步骤1,对当前帧图像进行人脸检测并获取人脸landmark的位置;
步骤2,利用检测到的人脸位置以及landmark坐标计算出眼部的区域,并截取眼部图片。
步骤3,利用预先训练好的神经网络模型进行眼部图片的分类,识别睁眼闭眼状态。
进一步,所述步骤1中对当前帧图像进行人脸检测采用的算法为MTCNN算法。
进一步,所述步骤2具体为:利用检测到的人脸位置以及landmark坐标计算出眼部的区域,取以两个眼睛之间的距离的0.4倍作为边长,两个眼睛坐标作为中心的正方形,分别截取两个正方形部分的图像作为眼部图片。
进一步,步骤3中所述的神经网络模型是基于深度学习网络MobileNet训练得到的分类模型;训练时采集不少于2000张不同光照条件下的眼部图片,并根据睁眼闭眼状态进行人工分类,构成训练集,对深度学习网络MobileNet进行训练。
本发明的有益效果是:
1.准确率高,利用mtcnn方法检测人脸,并利用深度学习的技术进行眼睛状态的分类,可以达到较高的准确率;
2.效率高,可以达到实时检测的效果,眼睛图片较小且睁眼闭眼特征较明显,可以使用比较高效的神经网络模型;
3.实施方便,只需要普通摄像头就可以完成该功能,不需要其他辅助设备。
附图说明
图1为本发明方法流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明方法流程图。如图1所示,一种睁眼闭眼状态检测方法,包括以下步骤:
步骤一,采用MTCNN算法对当前帧图像进行人脸检测并获取人脸landmark的位置。通过MTCNN算法可获取人脸的位置以及人脸landmark的位置,准确率高,速度快。
步骤二,利用步骤一中检测到的人脸位置以及landmark坐标计算出眼部的区域取以两个眼睛之间的距离的0.4倍作为边长,两个眼睛坐标作为中心的正方形,分别截取两个正方形部分的图像作为眼部图片。
步骤三,重复步骤一步骤二,收集大量的眼部图片,建议各种光线条件下收集2000张以上,并根据睁眼闭眼的状态人工进行分类。
步骤四,将步骤三中的图片集作为训练数据,对深度学习网络MobileNet进行分类训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉幻视智能科技有限公司,未经武汉幻视智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810572216.3/2.html,转载请声明来源钻瓜专利网。