[发明专利]语音信号处理方法、装置、可读存储介质及电子设备在审
申请号: | 202010014959.6 | 申请日: | 2020-01-07 |
公开(公告)号: | CN113096651A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 程光伟 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 可读 存储 介质 电子设备 | ||
1.一种语音信号处理方法,包括:
接收用户语音信号;
确定目标设备当前的工作状态;
如果所述目标设备当前的工作状态处于连续唤醒状态,确定所述用户语音信号中包括的有效的第一预设类型唤醒词;
基于所述第一预设类型唤醒词,从所述用户语音信号中提取待识别语音信号,并输出所述待识别语音信号。
2.根据权利要求1所述的方法,其中,所述确定所述用户语音信号中包括的有效的第一预设类型唤醒词,包括:
确定所述用户语音信号是否包括第一预设类型唤醒词;
如果包括,确定所述第一预设类型唤醒词的开始时间点之前的第一预设时长内是否接收到语音信号;
如果没有接收到语音信号,确定所述第一预设类型唤醒词为有效的唤醒词。
3.根据权利要求1所述的方法,其中,所述基于所述第一预设类型唤醒词,从所述用户语音信号中提取待识别语音信号,包括:
响应于从所述用户语音信号中确定出所述有效的第一预设类型唤醒词,等待第二预设时长后,确定所述用户语音信号中是否包括第二预设类型唤醒词;
如果包括第二预设类型唤醒词,将所述用户语音信号中的处于所述第二预设类型唤醒词之后的语音信号确定为待识别语音信号;
如果不包括第二预设类型唤醒词,将所述用户语音信号中的处于所述有效的唤醒词之后的语音信号确定为待识别语音信号。
4.根据权利要求1所述的方法,其中,在所述确定目标设备当前的工作状态之前,所述方法还包括:
响应于连续确定出预设数量个第二预设类型唤醒词,且确定出所述预设数量个第二预设类型唤醒词中的任意相邻两个唤醒词的间隔时间小于或等于第三预设时长,确定所述目标设备进入连续唤醒状态,其中,所述间隔时间不包括相邻两个主唤醒词之间的语句占用的时间。
5.根据权利要求4所述的方法,其中,所述方法还包括:
在所述连续唤醒状态,响应于确定两次唤醒之间的间隔时间大于或等于第四预设时长,确定所述目标设备退出所述连续唤醒状态。
6.根据权利要求1-5之一所述的方法,其中,所述输出所述待识别语音信号,包括:
将所述待识别语音信号发送至用于识别语音信号的设备;或者
将所述待识别语音信号进行噪声过滤处理后发送至用于识别语音信号的设备。
7.根据权利要求1-5之一所述的方法,其中,所述确定所述用户语音信号中包括的有效的第一预设类型唤醒词,包括:
基于预设的唤醒词识别模型,以及预设的在所述连续唤醒状态所用的第一概率阈值,确定所述用户语音信号包括的有效的第一预设类型唤醒词,其中,所述第一概率阈值小于在非连续唤醒状态所用的第二概率阈值。
8.一种语音信号处理装置,包括:
接收模块,用于接收用户语音信号;
第一确定模块,用于确定目标设备当前的工作状态;
第二确定模块,用于如果所述目标设备当前的工作状态处于连续唤醒状态,确定所述用户语音信号中包括的有效的第一预设类型唤醒词;
提取模块,用于基于所述第一预设类型唤醒词,从所述用户语音信号中提取待识别语音信号,并输出所述待识别语音信号。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010014959.6/1.html,转载请声明来源钻瓜专利网。