[发明专利]结合视频通道的智能家居语音控制系统及其控制方法有效

申请号：	201110174072.4	申请日：	2011-06-24
公开（公告）号：	CN102298443A	公开（公告）日：	2011-12-28
发明（设计）人：	徐向民;梁卓锐;王玥	申请（专利权）人：	华南理工大学
主分类号：	G06F3/01	分类号：	G06F3/01;G06K9/00;G06K9/62
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	罗观祥
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	结合视频通道智能家居语音控制系统及其控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及视频语音识别技术，尤其涉及结合视频通道的智能家居语音控制系统及其控制方法。

背景技术

目前，大部分复杂的家电都是通过遥控器的键盘输入方式进行遥控的，随着家居的智能化以及包含内容的多样化，为了优化操作方式、增强操作的舒适性，用户需要更加易于操作的遥控器。语言是人类最直接最方便的交流和表达方式，如果采用语音识别技术，可以将原来的被动静止结构转变为具有主动识别语音执行的智慧工具，从而满足人们日益增长的需求。

近年来，语音识别技术发展十分迅速，目前已出现了许多自动语音识别类的产品，例如IBM开发的ViaVoice语音系统等。但是这些系统仍然缺乏较强的抗干扰能力，原因是它只能单一地从语音信道中获取信息，当这些系统应用到真实环境中时，一旦有背景噪声或多人交叉说话，它们的性能将大大下降，并且这样的应用环境十分常见，如：办公室、汽车、工厂或机场等，就连家庭环境也是如此。

发明内容

为解决现有技术存在的缺点和不足，本发明提供结合视频通道的智能家居语音控制系统及其控制方法，相比现有技术所采用的控制方式，本发明抗干扰能力强，能够克服家庭环境中由于噪音干扰所带来的无法识别的技术问题。

本发明的目的通过下述技术方案实现：

结合视频通道的智能家居语音控制系统，包括依次连接的手势检测模块、人脸检测模块、识别系统模块、指令判断模块、指令显示与确认模块。

所述识别系统模块包括唇语部分和语音部分，所述唇语部分包括依次连接的人脸跟踪定位模块、唇语视频输入模块、唇语识别模块；所述语音部分包括依次连接的语音输入模块、语音识别模块。

结合视频通道的智能家居语音控制系统的识别方法，可通过如下步骤实现：

(1)手势检测

手势检测模块采用haar小波变换，以及LBP特征提取，选取Adaboost分类器对固定手势进行检测，判断用户是否获得控制权；

(2)人脸检测

人脸检测模块采用haar小波变换，选取Adaboost分类器对人脸进行检测，判断操作空间内是否有人，如果检测到人脸，则同时开启识别系统模块的唇语和语音两部分；

(3)人脸跟踪与定位

人脸跟踪与定位模块结合人脸检测模块输出的参数，按照人脸的大小以及位置，调整摄像头焦距和光轴，使人脸图像足够清晰，同时控制人脸处于图像中央位置，使人脸至少占图像的三分之二面积以上；