[发明专利]一种语音信息识别方法、装置及设备在审
申请号: | 201910707528.5 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110428838A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 王夏鸣 | 申请(专利权)人: | 大众问问(北京)信息科技有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L15/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户面部 语音信息识别 语音指令信息 装置及设备 环境语音 用户视线 持续监测 环境区域 目标用户 语音交互 响应 | ||
本发明实施例公开了一种语音信息识别方法、装置及设备,方法包括:持续监测并识别设定环境区域内的待识别信息;其中,所述待识别信息包括环境语音信息、用户面部信息、用户视线信息以及用户唇动信息;如果根据所述用户面部信息和所述用户唇动信息,或根据所述用户面部信息、所述用户视线信息以及所述用户唇动信息,确定所述环境语音信息包括目标用户发出的语音指令信息,则对所述语音指令信息进行响应。本发明实施例的技术方案能够提高语音交互效率。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种语音信息识别方法、装置及设备。
背景技术
语音识别技术用来基于用户输入的语音等将语音信号识别为与预定语言相对应的信号,并可以应用于多个领域。
目前的基于语音识别技术的语音识别系统,通常都需要用户通过手动唤醒或者由设备自动检测唤醒词的方式启动,从而触发后续的语音识别和交互。当语音对话任务完成时,系统很快恢复到需要重新唤醒的状态。
发明人在实现本发明的过程中,发现现有的语音识别系统存在如下缺陷:现有的语音识别系统无法模拟实现真人交流场景,每次交互均需唤醒启动的方式会降低交互效率。
发明内容
本发明实施例提供一种语音信息识别方法、装置及设备,实现提高语音交互效率。
第一方面,本发明实施例提供了一种语音信息识别方法,包括:
持续监测并识别设定环境区域内的待识别信息;其中,所述待识别信息包括环境语音信息、用户面部信息、用户视线信息以及用户唇动信息;
如果根据所述用户面部信息和所述用户唇动信息,或根据所述用户面部信息、所述用户视线信息以及所述用户唇动信息,确定所述环境语音信息包括目标用户发出的语音指令信息,则对所述语音指令信息进行响应。
第二方面,本发明实施例还提供了一种语音信息识别装置,包括:
待识别信息监测模块,用于持续监测并识别设定环境区域内的待识别信息;其中,所述待识别信息包括环境语音信息、用户面部信息、用户视线信息以及用户唇动信息;
语音指令信息响应模块,用于如果根据所述用户面部信息和所述用户唇动信息,或根据所述用户面部信息、所述用户视线信息以及所述用户唇动信息,确定所述环境语音信息包括目标用户发出的语音指令信息,则对所述语音指令信息进行响应。
第三方面,本发明实施例还提供了一种终端设备,所述终端设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的语音信息识别方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的语音信息识别方法。
本发明实施例通过持续监测并识别设定环境区域内的环境语音信息、用户面部信息、用户视线信息以及用户唇动信息,在根据用户面部信息、用户视线信息以及用户唇动信息确定环境语音信息包括目标用户发出的语音指令信息时,对语音指令信息进行响应,解决现有语音识别系统存在的语音交互效率低的问题,实现提高语音交互效率。
附图说明
图1是本发明实施例一提供的一种语音信息识别方法的流程图;
图2a是本发明实施例二提供的一种语音信息识别方法的流程图;
图2b是本发明实施例二提供的一种语音信息识别方法的流程图;
图3是本发明实施例三提供的一种语音信息识别装置的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大众问问(北京)信息科技有限公司,未经大众问问(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910707528.5/2.html,转载请声明来源钻瓜专利网。