[发明专利]一种语音交互设备唤醒方法、装置、设备及存储介质在审
申请号: | 201910026336.8 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109448725A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘勇;周冀;薛向东;王芃;赵立峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/00;G10L17/22 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音交互设备 唤醒 存储介质 采集语音信号 比对结果 模型判断 声纹特征 预先存储 词识别 比对 | ||
本发明实施例提出一种语音交互设备唤醒方法、装置、设备及存储介质,其中方法包括:采集语音信号;提取所述语音信号的第一声纹特征;将所述第一声纹特征与预先存储的基准声纹特征进行比对;当比对结果一致时,采用唤醒词识别模型判断所述语音信号的内容是否包含唤醒词,如果包含,则唤醒语音交互设备。发明实施例能够降低语音交互设备的误唤醒率。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种语音交互设备唤醒方法、装置、设备及存储介质。
背景技术
现有的语音交互设备存在被误唤醒的情况。例如,被电视机、广播等装置播放的语音信号误唤醒;或者,在用户说话的内容中不包含唤醒词时,错误地从中识别出唤醒词,因而被误唤醒。这些被误唤醒的情况影响用户的使用体验。
发明内容
本发明实施例提供一种语音交互设备唤醒方法及装置,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种语音交互设备唤醒方法,包括:
采集语音信号;
提取所述语音信号的第一声纹特征;
将所述第一声纹特征与预先存储的基准声纹特征进行比对;
当比对结果一致时,采用唤醒词识别模型判断所述语音信号的内容是否包含唤醒词,如果包含,则唤醒语音交互设备。
在一种实施方式中,预先存储至少一个基准声纹特征;
所述将所述第一声纹特征与预先存储的基准声纹特征进行比对,包括:将所述第一声纹特征分别与预先存储的各个基准声纹特征进行比对,当第一声纹特征与其中一个基准声纹特征一致时,比对结果一致。
在一种实施方式中,所述至少一个基准声纹特征的确定方式为:
采集至少一个用户的语音信号,提取各个用户的语音信号的第二声纹特征,将每个所述第二声纹特征确定为一个所述基准声纹特征。
在一种实施方式中,预先建立分别对应各个基准声纹特征的唤醒词识别模型;
所述采用唤醒词识别模型判断所述语音信号的内容是否包含唤醒词,包括:确定与所述第一声纹特征的比对结果一致的基准声纹特征;获取对应确定的基准声纹特征的唤醒词识别模型;采用获取的唤醒词识别模型判断所述语音信号。
在一种实施方式中,所述预先建立分别对应各个基准声纹特征的唤醒词识别模型,包括:
针对各个基准声纹特征,分别执行以下步骤:
采用具备所述基准声纹特征的正样本和负样本训练所述唤醒词识别模型;所述正样本为包含所述唤醒词并且能够唤醒所述语音交互设备的语音信号,所述负样本为不包含所述唤醒词并且能够唤醒所述语音交互设备的语音信号。
第二方面,本发明实施例还提出一种语音交互设备唤醒装置,包括:
采集模块,用于采集语音信号;
提取模块,用于提取所述语音信号的第一声纹特征;
比对模块,用于将所述第一声纹特征与预先存储的基准声纹特征进行比对;
判断及唤醒模块,用于当比对结果一致时,采用唤醒词识别模型判断所述语音信号的内容是否包含唤醒词,如果包含,则唤醒语音交互设备。
在一种实施方式中,还包括:声纹存储模块,用于存储至少一个基准声纹特征;
所述比对模块,用于将所述第一声纹特征分别与预先存储的各个基准声纹特征进行比对,当第一声纹特征与其中一个基准声纹特征一致时,比对结果一致。
在一种实施方式中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910026336.8/2.html,转载请声明来源钻瓜专利网。