[发明专利]一种机器交互启动触发方法及系统在审
申请号: | 201811388163.6 | 申请日: | 2018-11-21 |
公开(公告)号: | CN109582139A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 邓立邦 | 申请(专利权)人: | 广东智媒云图科技股份有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;宋静娜 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户图像 触发 目标图像 嘴巴 人脸识别技术 交互逻辑 用户需求 自动触发 注视 说话 | ||
本发明公开了一种机器交互启动触发方法及系统,所述方法包括如下步骤:步骤S1,获取多张用户图像;步骤S2,基于人脸识别技术,获取所述多张用户图像中眼睛处于注视状态且嘴巴说话的用户图像作为目标图像;步骤S3,根据所述目标图像触发启动所述机器交互逻辑,本发明可基于眼睛和嘴巴变化实现自动触发机器交互的目的,使人机交互效果更满足用户需求。
技术领域
本发明涉及图象识别处理技术领域,特别是涉及一种机器交互启动触发方法及系统。
背景技术
随着社会经济和计算机技术的不断发展,人类生活水平不断提高。为了提高生活娱乐性以及满足人类需求,各种智能产品应运而生。
智能产品,利用计算机、网络通信、自动控制、感知识别等技术,把相关各种应用子系统有机结合,通过综合管理,提供全方位的信息交换,实现人机自然交互,优化人类生活,如:智能手机、智能音箱、智能家居等。目前,这些智能产品较为普遍的触发方式有震动、光感、声音、手势,而声音触发基于自身便利性,受到普遍大众青睐。
然而,根据调查研究,市面流行的声音触发智能产品,普遍存在以下不足:1)实现人机交互的前提是接收特定的语音唤醒词指令,即:没有特定的唤醒词指令,交互无法启动进行;2)不同产品的语音唤醒词指令不同,约束产品通用性,用户需要提前获悉并记忆唤醒词,使用门槛高;3)部分产品具有休眠状态,需要通过触摸等物理方式唤醒语音接收功能,用户需要具备专业知识。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种机器交互启动触发方法及系统,以基于眼睛和嘴巴变化实现自动触发机器交互的目的,使人机交互效果更满足用户需求。
为达上述及其它目的,本发明提出一种机器交互启动触发方法,包括如下步骤:
步骤S1,获取多张用户图像;
步骤S2,基于人脸识别技术,获取所述多张用户图像中眼睛处于注视状态且嘴巴说话的用户图像作为目标图像;
步骤S3,根据所述目标图像触发启动所述机器交互逻辑。
优选地,于步骤S1中,利用摄像头实时抓拍现场用户视频,并利用视频处理技术提取视频,从中提取多张静态图像,并基于抽取的多张静态图像,从中选取图像中头部面积与整体图像面积占比大于一预设阈值的图像,作为用户图像。
优选地,于步骤S1中,所述预设阈值大于或等于十分之一。
优选地,步骤S2进一步包括:
步骤S200,对获得的用户图像,基于人脸识别技术,获得图像中人脸区域以及对应的人脸特征图;
步骤S201,根据人脸特征图及其对应的双眼位置不同、嘴巴关键点是否发生位移获得所述目标图像。
优选地,步骤S201进一步包括:
步骤S201a,基于人脸识别技术,分别获得用户图像中包括左/右眼关键点的矩形框宽度;
步骤S201b,根据左右眼关键点的矩形框宽度确定该用户图像的头部转向,获得处于注视状态的用户图像;
步骤S201c,基于眼睛处于注视状态的用户图像,跟踪连续视频帧的图像中嘴巴的关键点,确定嘴巴关键点是否发生位移;
步骤S201d,将眼睛处于注视状态且嘴巴关键点发生位移的用户图像作为目标图像。
优选地,于步骤S201b中,若当前图像的包括左/右眼关键点的矩形框宽度的差值小于预设阈值,则判定当前图像处于注视状态。
优选地,于步骤S201b中,若当前图像的包括左眼关键点的矩形框宽度小于右眼关键点的矩形框宽度,且差值超过预设阈值时,则判定当前图像中用户头部转向左边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东智媒云图科技股份有限公司,未经广东智媒云图科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811388163.6/2.html,转载请声明来源钻瓜专利网。