[发明专利]人机交互方法及装置有效
申请号: | 201911064717.1 | 申请日: | 2019-10-30 |
公开(公告)号: | CN111063354B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李旭滨;王利平 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L15/22;G06V40/16;G06V10/44;G06F9/4401 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机交互 方法 装置 | ||
本公开是关于一种人机交互方法及装置。该方法包括:获取环境的声音信号;在确定所述环境的声音信号大于或等于预设值时,通过所述摄像头获取唇部状态信号和语音信号;其中,所述唇部状态信号包括唇动状态和未唇动状态;根据所述唇动状态发生的时刻和所述未唇动状态发生的时刻,从所述语音信号中确定待识别语音信号;对所述待识别语音信号进行识别;在确定所述待识别语音信号与预设信号匹配时,开启对话系统。该技术方案在电子设备处于嘈杂环境中时,可以根据唇部状态信号来对嘈杂环境中获取的语音信号进行断句,准确的获取唤醒词,实现了对电子设备的准确唤醒,提高了用户体验。
技术领域
本公开涉及人机交互技术领域,尤其涉及一种人机交互方法及装置。
背景技术
随着信息技术的不断发展,智能大屏或者带屏的硬件机器人等电子设备已逐渐普及。
相关技术中,在唤醒电子设备时,需要用户语音输入唤醒词,电子设备在接收到用户输入的唤醒词与预设唤醒词进行匹配,在确定唤醒词与预设唤醒词匹配时,则主动唤醒电子设备,用户就可以通过语音与电子设备实现人机交互。
但上述唤醒电子设备的方法,若电子设备所处环境比较嘈杂,则电子设备接收到的语音信号比较杂乱,无法正确实现唤醒词的断句,从而导致无法唤醒或者误唤醒电子设备,降低了人机交互体验。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种人机交互方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种人机交互方法,应用于具备摄像头的电子设备,所述方法包括:
获取环境的声音信号;
在确定所述环境的声音信号大于或等于预设值时,通过所述摄像头获取唇部状态信号和语音信号;其中,所述唇部状态信号包括唇动状态和未唇动状态;
根据所述唇动状态发生的时刻和所述未唇动状态发生的时刻,从所述语音信号中确定待识别语音信号;
对所述待识别语音信号进行识别;
在确定所述待识别语音信号与预设信号匹配时,开启对话系统。
本公开的实施例提供的技术方案可以包括以下有益效果:在检测到环境的声音信号大于或等于预设值时,获取唇部状态信号和语音信号,其中,唇部状态信号包括唇动状态和未唇动状态,根据发生唇动状态的时刻和未发生唇动状态的时刻从语音信号中确定出待识别语音信号,进而对待识别语音信号进行识别,当待识别语音信号与预设信号匹配时,则确定唤醒成功,开始对话系统进行人机交互。这样,在电子设备处于嘈杂环境中时,可以根据唇部状态信号来对嘈杂环境中获取的语音信号进行断句,准确的获取唤醒词,实现了对电子设备的准确唤醒,提高了用户体验。
在一个实施例中,还包括:
在确定所述环境的声音信号小于所述预设值时,通过所述摄像头获取目标物的脸部信号;
根据所述脸部信号确定所述目标物的停留时间;
在确定所述目标物的停留时间大于第一预设时间时,开启所述对话系统。
在一个实施例中,在所述开启对话系统之后,还包括:
获取所述目标物输入的语音指令信息;
对所述语音指令信息进行语义识别,得到语义信息;
获取与所述语义信息匹配的语音响应信息;
播放所述语音响应信息。
在一个实施例中,在所述播放所述语音响应信息之后,还包括:
对所述对话系统的轮数进行计数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911064717.1/2.html,转载请声明来源钻瓜专利网。