[发明专利]语音唤醒方法、电子设备和存储介质在审
申请号: | 202111570928.X | 申请日: | 2021-12-21 |
公开(公告)号: | CN114155857A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 邓建凯;陈家欢;甘津瑞;俞凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L25/78 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 唤醒 方法 电子设备 存储 介质 | ||
本发明公开语音唤醒方法、电子设备和存储介质,其中,一种语音唤醒方法,包括:持续缓存用户音频流,判断所述用户音频流是否能够触发唤醒;响应于用户音频流触发唤醒,将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测;在语音活性检测模块检测的同时实时将回退音频流发送至服务器端进行识别得到第一识别结果;判断第一识别结果中是否包含除唤醒词之外的其他人声;若第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式。通过在语音活性检测模块检测的同时实时将回退音频流发送至服务器端进行识别得到第一识别结果,从而可以实现精准的判断是否进入oneshot模式。
技术领域
本发明属于语音数据处理技术领域,尤其涉及语音唤醒方法、电子设备和存储介质。
背景技术
现有oneshot方案大多数为离线方案,离线方案通过Wakeup(对音频数据进行实时检测,输出是否命中关键词)、Vad(语音活动检测,Voice Activity Detection)判断是否有人声来决策是否为oneshot(一种响应唤醒加命令一起连说的交互模式)模式,现有方案都使用了Wakeup+Vad。
现有离线方案的方法步骤包括:Vad实时缓存当前的语音音频;语音人声输入唤醒词,这时Wakeup会触发唤醒;将唤醒之后音频送给Vad,在规定的时候内检测是否可以触发Vad的开始;如果在规定时间内触发了Vad的开始,则说明是onehsot模式,否则可以判定为非oneshot模式。
发明人在实现本申请的过程中发现,现有离线方案的无法解决两个问题:人声输入唤醒词触发唤醒的时间点滞后和人声输入唤醒词触发唤醒的时间点提前。其中,人声输入唤醒词触发唤醒的时间点滞后导致唤醒之后的音频送Vad无法触发Vad的开始,导致用户实际为oneshot说法但没有命中oneshot模式;人声输入唤醒词触发唤醒的时间点提前导致唤醒之后的音频送Vad提前触发Vad的开始,导致用户实际为非oneshot说法但命中了oneshot模式。
发明内容
本发明实施例提供一种语音唤醒方法和装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音唤醒方法,包括:持续缓存用户音频流,判断所述用户音频流是否能够触发唤醒;响应于所述用户音频流触发唤醒,将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测,其中,所述语音活性检测模块在检测到第二预设时间间隔的非人声后结束检测;在所述语音活性检测模块检测的同时实时将所述回退音频流发送至服务器端进行识别得到第一识别结果;判断所述第一识别结果中是否包含除唤醒词之外的其他人声;若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式,其中,所述oneshot模式为响应唤醒词和命令词一起连说的模式。
第二方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的语音唤醒方法的步骤。
第三方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的语音唤醒方法的步骤。
本申请的方法、电子设备和存储介质通过将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测,从而可以实现一定可以触发语音活性检测,进一步地,在语音活性检测模块检测的同时实时将回退音频流发送至服务器端进行识别得到第一识别结果,从而可以实现精准的判断是否进入oneshot模式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111570928.X/2.html,转载请声明来源钻瓜专利网。