[发明专利]一种基于视觉图像信息的眼动交互系统在审
申请号: | 202210432529.5 | 申请日: | 2022-04-23 |
公开(公告)号: | CN114821753A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 印二威;谢良;胡永强;闫野;张敬;张亚坤;艾勇保;张皓洋 | 申请(专利权)人: | 中国人民解放军军事科学院国防科技创新研究院 |
主分类号: | G06V40/18 | 分类号: | G06V40/18;G06V10/774;G06V10/82;G06N3/04;G06F3/01 |
代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 李学康 |
地址: | 100071 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 图像 信息 交互 系统 | ||
本发明公开了一种基于视觉图像信息的眼动交互系统,包括头戴式AR眼镜、睁闭眼识别模块、注视点坐标预测模块、闭眼计时模块和指令集识别模块。头戴式AR眼镜逐帧采集双眼图像,睁闭眼识别模块负责识别左右双眼分别处于睁眼状态还是闭眼状态,如果睁闭眼识别模块将双眼图像都识别为睁眼状态,则利用注视点坐标预测模块实时预测当前双眼的注视点坐标。如果有一只眼睛图像识别为闭眼状态或者双眼图像都识别为闭眼状态,则利用指令集识别模块对眼动动作指令进行判别。本发明系统无须繁琐的标定过程,可以随戴随用,同时具有良好的自适应性和鲁棒性,具有低成本以及适用性广泛的优点。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及到一种基于视觉图像信息的眼动交互系统。
背景技术
相比较于其它人机交互方式,眼动交互是人与其它对象最直接、最自然的一种交互方式,在人机交互领域有着广泛的应用前景,其更是AR、VR等设备的重要组成部分。传统的眼动交互方法往往依赖特有设备且需要使用者完成复杂的校准过程。比如,现在头戴式AR设备中普遍采用红外校准方式,其需要使用者在每次佩戴时完成多点的标定工作,通过红外光在眼球上的多点反射确定相对位置关系,这种方式不仅使用流程繁琐且还会受到环境光和佩戴过程中发生的位置偏移的影响。
发明内容
针对现有的眼动交互方法使用流程繁琐且易受到其它因素影响的问题,本发明公开了一种基于视觉图像信息的眼动交互系统,通过摄像头采集的人眼眼部图像就可以实时预测出人眼视线的方向并且实现包括“眨眼确认”在内的多种眼部动作指令。
本发明公开了一种基于视觉图像信息的眼动交互系统,包括头戴式AR眼镜、睁闭眼识别模块、注视点坐标预测模块、闭眼计时模块和指令集识别模块,头戴式AR眼镜与睁闭眼识别模块相连接,睁闭眼识别模块与注视点坐标预测模块相连接,注视点坐标预测模块与指令集识别模块相连接,闭眼计时模块与睁闭眼识别模块相连接。头戴式AR眼镜的近眼摄像头逐帧采集双眼图像,并将每一帧双眼图像送入睁闭眼识别模块,睁闭眼识别模块负责识别左右双眼分别处于睁眼状态还是闭眼状态,如果睁闭眼识别模块将双眼图像都识别为睁眼状态,则利用注视点坐标预测模块实时预测当前双眼的注视点坐标。如果睁闭眼识别模块识别双眼图像中有一只眼睛图像识别为闭眼状态或者双眼图像都识别为闭眼状态,则利用指令集识别模块对眼动动作指令进行判别,眼动动作指令在人机交互中起到指令作用。眼动动作指令包括眨眼确认等。闭眼计时模块负责对连续闭眼状态的持续时间进行统计,其采用按帧计数的方式对时间进行统计。双眼的注视点坐标是指被试者双眼注视屏幕时,双眼视线交汇于屏幕上的一点的坐标。双眼图像包括左右两个单眼图像。
睁闭眼识别模块采用三层隐藏层的卷积神经网络进行睁眼闭眼的二分类识别,该卷积神经网络的输入为每一帧的单眼图像,输出为睁眼或者闭眼的二分类识别结果,三层隐藏层分别为卷积层、池化层以及全连接层。
所述的睁闭眼识别模块的构建,首先需要构建样本数据集,其次是搭建卷积神经网络,最后是对所搭建的卷积神经网络进行训练和测试。
所述的构建样本数据集,采集N个人的睁眼闭眼图片各M张,在采集过程中,在头戴式AR眼镜的近眼摄像头能采集到完整双眼图像的前提下,确保采集环境光线、近眼摄像头相对被采集者的位置和角度均具有多样性,对所采集到的NM张图像样本分别采用旋转、平移、亮度变化等方式,将其扩增至3NM张图像样本以上,将扩增后的图像样本作样本数据集。
所述的搭建卷积神经网络,该卷积神经网络的第一层为卷积层。第二层为池化层,采用最大池化方案。第三层即为全连接层,该层采用线性拟合的方式得到预测结果,三个层依次连接,激活函数采用ReLU激活函数,并将该激活函数添加至卷积层之后。
所述的对所搭建的卷积神经网络进行训练和测试,对样本数据集进行尺寸缩放、归一化和标准化处理,将处理过的样本数据转化为PyTorch可处理的Tensor向量,作为该卷积神经网络的输入,该卷积神经网络的梯度更新采用随机梯度下降算法,该卷积神经网络的参数优化采用Adam函数。采用交叉验证法对样本数据集进行划分并进行迭代训练及测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院,未经中国人民解放军军事科学院国防科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210432529.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置