[发明专利]利用人机交互手势唤醒智能设备的方法及装置在审

申请号：	201810153143.4	申请日：	2018-02-11
公开（公告）号：	CN108399009A	公开（公告）日：	2018-08-14
发明（设计）人：	田泽康;李辉芳;邓卉;谢建	申请（专利权）人：	易视腾科技股份有限公司
主分类号：	G06F3/01	分类号：	G06F3/01;G06F3/0484;G06F9/4401;G06K9/00
代理公司：	北京联创佳为专利事务所(普通合伙) 11362	代理人：	郭防
地址：	214135 江苏省无锡市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	静音信号手势手势检测拍摄图像人机交互智能设备唤醒静音人脸语音识别功能人脸分类器摄像头比例参数后台启动人脸检测帧数据检测视屏混淆后台语音播放拍摄广播统计
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种利用人机交互手势唤醒智能设备的方法，其特征在于，包括如下步骤：

S110、利用设备的摄像头对用户进行拍摄，将当前时刻拍摄到的图像存为Image；

S120、使用Haar进行人脸检测，在图像Image中检测出所有超过预设大小Face_Size的人脸矩形列表Face_Rect_List；预设大小的定义可为尺寸大小，具体可用长宽方向上的像素数量来表征；

S130、根据统计的多人静音手势与人脸比例参数，基于返回的人脸框列表Face_Rect_List设置手势检测的感兴趣区域Rect_Roi_List；

S140、在手势检测的感兴趣区域Rect_Roi_List中进行静音手势检测，如若检测到目标，则返回值Is_Mute为true并进入步骤S150；如若没有检测到则Is_Mute为false并进入步骤S120；

S150、将所述静音信号Is_Mute传入后台，判断静音信号Is_Mute为true时，暂停当前播放视屏或广播，在所述后台启动语音识别功能；判断静音信号Is_Mute为false时，执行步骤S120，对下一帧数据进行处理。

2.根据权利要求1所述的利用人机交互手势唤醒智能设备的方法，其特征在于，所述步骤S120包括：

将所述拍摄图像进行预处理转换成灰度图像，将所述灰度图像作为输入，使用Haar分类器进行检测，若检测到人脸，则返回人脸的坐标参数，并进入到步骤S130；若没有检测到人脸，则进入步骤S120，处理下一帧拍摄图像；其中，所述人脸矩形列表Face_Rect_List由多个人脸框Face_Rect组成，其中Face_Rect的定义为[face_x，face_y，face_width，face_height]，face_x为人脸框的左上角的x坐标，face_y为人脸框的左上角的y坐标，face_width为人脸框的宽，face_height为人脸框的高。

3.根据权利要求2所述的利用人机交互手势唤醒智能设备的方法，其特征在于，所述步骤S130中，所述手势检测区域Rect_Roi_List由多个Rect_Roi组成，Rect_Roi的定义为[face_x-0.1*face_width，face_y+face_height，1.2*face_width，1.4*face_height]，对每个人脸框Face_Rect生成手势检测区域Rect_Roi。

4.根据权利要求3所述的利用人机交互手势唤醒智能设备的方法，其特征在于，所述步骤S140包括：

使用Sliding Window的方式遍历手势检测区域Rect_Roi_List从而得到多个候选框，将所述候选框输入到静音检测模型中进行检测；若检测到目标做了静音的动作，则设置静音信号Is_Mute为true，反之则设置静音信号Is_Mute为false。

5.根据权利要求4所述的利用人机交互手势唤醒智能设备的方法，其特征在于，所述静音检测模型为基于opencv自带的Haar分类器进行训练得到的模型。

6.一种利用人机交互手势唤醒智能设备的装置，包括后台运行装置，其特征在于，还包括：

拍摄图像获取装置，用于获取利用摄像头对用户进行拍摄所得的图像；

人脸框列表获取装置，用于利用人脸分类器对所述拍摄的图像进行人脸检测，获取尺寸超出预设大小的人脸框列表；

手势检测区域列表获取装置，用于根据统计的多人静音手势与人脸比例参数，基于返回的人脸框列表设置手势检测区域列表；

静音手势检测装置，用于在手势检测区域列表中的手势检测区域进行静音手势检测，如若检测到目标，则设置静音信号Is_Mute为true，如若没有检测到所述目标，则设置所述静音信号Is_Mute为false，并将所述静音信号Is_Mute传输给所述后台运行装置；

所述后台运行装置用于接收所述静音信号Is_Mute，判断所述静音信号Is_Mute为true时，暂停当前播放视屏或广播，在所述后台启动语音识别功能；判断所述静音信号Is_Mute为false时，致使所述人脸框列表获取装置对下一帧数据进行处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于易视腾科技股份有限公司，未经易视腾科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810153143.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F3-00 用于将所要处理的数据转变成为计算机能够处理的形式的输入装置；用于将数据从处理机传送到输出设备的输出装置，例如，接口装置
G06F3-01 .用于用户和计算机之间交互的输入装置或输入和输出组合装置
G06F3-05 .在规定的时间间隔上，利用模拟量取样的数字输入
G06F3-06 .来自记录载体的数字输入，或者到记录载体上去的数字输出
G06F3-09 .到打字机上去的数字输出
G06F3-12 .到打印装置上去的数字输出

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]利用人机交互手势唤醒智能设备的方法及装置在审

专利文献下载