[发明专利]基于多特征点组合的人机交互信息生成方法在审
申请号: | 201310175199.7 | 申请日: | 2013-05-10 |
公开(公告)号: | CN103279767A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 佘青山;杨伟健;昌凤玲 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 组合 人机交互 信息 生成 方法 | ||
技术领域
本发明属于人机接口领域,涉及一种基于多特征点组合的人机交互信息生成方法。
背景技术
随着经济的发展和文明程度的提高,残疾人这个特殊群体的生存状况正越来越受到社会的关注。2007年,第二次全国残疾人抽样调查结果表明,我国现有残疾人总数约为8296万,占全国总人口的比例超过6%,其中肢体残疾2412万,是各类残疾中比重最高的。与此同时,《中国人口老龄化发展趋势预测研究报告》预计,2014年我国老年人口规模将达到2亿,2051年将达到4.37亿,老龄人是脑卒中病的高发群体,患者中存在不同程度的肢体残疾。改善残疾人生存状况,提高残疾人自理能力和生活质量,已是全社会关注的重点问题,成为全面建设小康与和谐社会的一项重要而紧迫的任务。
改善患者活动能力,拓展患者运动范围,是对肢体残疾患者进行康复治疗的主要目的和途径。对于截肢等严重肢体残疾患者,由于运动功能的缺损或丧失,活动范围和活动空间受到制约,如何增强患者的运动能力,已成为生物医学和工程技术领域的一个重要课题。一方面,从人体运动的源头出发,分析大脑对肢体运动及控制的支配功能,通过获取大脑的运动思维信息,从而得到肢体动作指令,实现脑-机交互;另一方面,从人体运动的主体出发,通过开发假肢、轮椅等康复辅助器具,代偿实现患者缺失的运动功能,扩大活动范围和生活自理能力。摆脱操纵杆、按键等传统人机接口的束缚,通过语音、形体语言等人类习惯和自然的方式与智能设备(包括康复辅具)进行沟通,让其提供智能的主动服务,已成为当前人机交互的一个重要研究领域,受到相关研究机构及科研人员的广泛关注。然而以语音、形体语言为表达方式的模式识别及控制技术在康复辅具中的应用,还面临诸多难题。如复杂环境下模式识别精度不高,人机交互不够自然,特别是易受光线变化、复杂环境等干扰,仍然存在关键特征点定位精度和头部姿势识别准确率不高而生成错误人机交互信息等问题,是新型人机接口实用化和智能化的一个普遍性难点。因此在头部姿势估计上开展研发,具有重要的技术研发价值和广泛的市场应用前景。
发明内容
本发明的目的就是针对现有基于视觉控制的人机接口领域中因复杂环境中头部姿势识别准确率不高而导致生成错误人机交互信息的问题,提供一种基于多特征点组合的人机交互信息生成方法。
头部视觉信号能较好传达控制者的意图,具有作为无接触式自然交互信息源的可行性。当使用者在人机交互过程中,总会因环境的变化而产生一些特征点的误定位或者漏定位,系统可能会生成错误的人机交互信息,容易引起误操作。因此,本发明研究的基于多特征点组合的人机交互信息生成方法,可以提高复杂环境下人机交互信息生成的准确性,能够有效地避免因特征点的误定位或者漏定位而引起误操作。
为了实现以上目的,本发明方法主要包括以下步骤:
步骤(1) 头部视频序列获取。头部视觉信息通过光学镜头及CMOS图像传感器组件获取。
步骤(2) 图像序列预处理。将获取的图像序列进行灰度化、直方图均衡化、形态学预处理方法,对获取的头部图像序列进行消噪,增强图像头部的有效信息。
步骤(3) 人脸及特征点检测。先采用Adaboost算法对步骤(2)增强后的图像序列进行人脸检测,然后将人脸图像作为输入图像,同样采用Adaboost算法进行眼睛、鼻子、嘴巴定位,从而获取特征点。
步骤(4) 特征点组合定义与识别。根据步骤(3)已定位的特征点,先定义三种特征点组合,再设计识别规则对三种特征点组合进行识别。
步骤(5) 人机交互信息生成。根据步骤(4)中三种特征点组合的识别结果自定义设计并生成人机交互信息。
本发明与已有的人机交互信息生成方法相比,具有如下特点:
1、使用者头部运动不受限制。
在已有的智能人机交互中,人机交互信息的生成需要使用者头部尽量保持在某一位置进行相应操作,比如使用者的头部与摄像装置保持一定距离,或者使用者头部要保持在视频图像中间等。这样就会使使用者感到束缚,不自然。而本发明对识别规则进行了相应的设计,使用者的头部可以左右或者前后运动,但不会影响人机交互信息的正确生成,增强使用者的操控性,使使用者可以较自然的进行人机交互。
2、本发明可以实时并较高准确率地生成人机交互信息。
经过不同环境下的多次测试统计,本发明中三种特征点组合可以获得较高的识别率,因此也能较高准确率地生成人机交互信息,完全可以实时地进行人机交互。
附图说明
图1为本发明的实施流程图。
图2为各个特征点的坐标参数图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310175199.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种链式冷床拉钢机拉钢小车限位装置
- 下一篇:煲制蘑菇的方法