[发明专利]基于深度相机的眼控辅助输入方法在审
申请号: | 201910996250.8 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110794963A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 李天军;宋红伟;杨敏玲;陈胜勇 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00 |
代理公司: | 11465 北京慕达星云知识产权代理事务所(特殊普通合伙) | 代理人: | 曹鹏飞 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视线 辅助输入 人机交互 深度相机 眼部特征 眼睛注视 移动选择 用户使用 空格键 数字键 注视点 敲击 眼球 录入 选中 鼠标 屏幕 | ||
本发明公开了一种基于深度相机的眼控辅助输入方法,该方法可以根据人的眼球以及眼部特征确定视线的方向以及视线与屏幕注视点的坐标,得到用户所要输入的内容,能够在眼睛注视选择的过程中就选中需要的字词,直接敲击空格键便可以实现录入,这样省去了鼠标的移动选择或者数字键的点击,提升了用户使用的便捷程度,提高了人机交互的友好程度。
技术领域
本发明涉及智能输入技术领域,更具体的说是涉及一种基于深度相机的眼控辅助输入方法。
背景技术
目前,打字输入是使用电子设备过程中一项非常重要且使用频率较高的输入方式。在日常使用的输入法当中最为常用的输入法大都是使用拼音进行输入,输入过程中输入法会根据词组的意义以及用户平时对固定词组的使用频率和用户习惯优先给出使用者选择可能性最大的字词,使用频率越高、选择可能性越大的字词会出现在靠前的位置,如果出现在输入面板第一个位置的字词是用户所需要的字词,此时只需点击空格便可以选中录入。
但是,由于用户的使用频率以及词组组合的可能性等原因,并非每次用户需要的字词都可以出现在首位。这种情况之下用户需要从待选栏中选取自己所需要的字词,通常是通过点击鼠标或者键盘上的数字键来进行选择。使用者的手需要离开字母键盘或者整个键盘,并且在使用数字键的时候也容易选择错误,这样影响了在文字录入过程之中的速度与准确性。
因此,如何提供一种待选字词选择过程更加便捷、准确辅助输入方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于深度相机的眼控辅助输入方法,该方法可以根据人的眼球以及眼部特征确定视线的方向以及视线与屏幕注视点的坐标,得到用户所要输入的内容,克服了现有的输入方式录入速度及准确率低的问题。
为了实现上述目的,本发明采用如下技术方案:
一种基于深度相机的眼控辅助输入方法,该方法包括:
将Kinect摄像机固定安装于计算机显示器的正上方,通过Kinect摄像机对屏幕前的用户进行拍摄,得到用户图像;
使用基于AMM模型的人脸识别算法获取用户图像中的人脸区域;
在人脸区域中使用级联分类器与Haar-likee特征相结合的方法获取眼部区域,并通过区域生长的方式缩小眼部区域的范围,得到最终的人眼区域;
在人眼区域中使用星射线法确定瞳孔中心点坐标;
从人脸区域中提取多个特征点,由Kinect摄像机直接获取各个特征点的深度信息;
将瞳孔中心点分别与左右眼角坐标进行连线,分别计算左右眼角与瞳孔中心的偏移量,得到眼动偏移量;
利用人脸区域中的特征点,使用ICP算法求取头部运动的旋转矩阵和平移矩阵,获得头部姿态;
通过多组用户在多种不同姿态下注视多组坐标已知的位置点,分别获取用户的眼动偏移量以及头部姿态与屏幕坐标之间的多组对应数据;将多组对应数据输入训练神经网络,得到网络模型;
使用训练所得的网络模型,预测注视点的位置坐标;
将注视点的位置坐标传递给鼠标控制函数,控制鼠标移动到注视点所在位置,敲击空格键实现鼠标左键的点击选择需要的字词。
进一步地,通过区域生长的方式缩小眼部区域的范围,具体包括:
步骤1:对眼部区域的图像顺序扫描,寻找第一个没有归属的像素,设所述像素的坐标为(x0,y0);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910996250.8/2.html,转载请声明来源钻瓜专利网。