[发明专利]提升唤醒性能的方法和装置在审
申请号: | 201910801354.9 | 申请日: | 2019-08-28 |
公开(公告)号: | CN110517670A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 焦蓓;周强;徐俊峰 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/22;G10L25/78 |
代理公司: | 11400 北京商专永信知识产权代理事务所(普通合伙) | 代理人: | 黄谦;邓婷婷<国际申请>=<国际公布>= |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 自适应 语音帧 有效语音 方法和装置 非语音帧 判定 神经网络学习 多分类模型 反例样本 唤醒设备 输出确定 正例样本 嘈杂环境 输出 检测 申请 监督 | ||
本发明公开提升唤醒性能的方法和装置,其中,一种提升唤醒性能的方法,包括:以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;基于判定的疑似语音帧和非语音帧确定有效语音段;将所述有效语音段输入至自适应唤醒模型中,其中,所述自适应唤醒模型是基于收集的唤醒词正例样本和非唤醒词反例样本进行有监督地深度神经网络学习后获取的一个多分类模型;以及获取所述自适应唤醒模型的输出,基于所述输出确定是否唤醒设备。本申请的方法和装置提供的方案加入自适应唤醒模型对有效语音段进行自适应唤醒,从而能够有效的提升唤醒率,尤其是在嘈杂环境中效果尤为明显。
技术领域
本发明属于语音唤醒技术领域,尤其涉及提升唤醒性能的方法和装置。
背景技术
相关技术中,目前市场上还没有即提升唤醒率又降低误唤醒的样例。唤醒和误唤醒是此消彼长的关系,目前市场上都是择其一做优化,保持一方基本不降的基础上,优化另一方。在降低误唤醒方面,比较有代表的是添加二次验证;提升唤醒率方面,主要是降低唤醒门槛。
发明人在实现本申请的过程中发现,现有技术中主要存在以下方案:
1、添加二次验证模块,设置双重门限,唤醒引擎将接收的语音信号进行初步判断,当满足预设条件则开启二次验证,由二次验证的结果确定设备是否执行唤醒操作;
2、降低唤醒门槛,最简单快捷的就是降低唤醒阈值,达到容易唤醒的目的。
其中,一方面,二次验证会增加设备的功耗,加大延迟,影响用户在实际中的交互体验;另外,在一些运算资源有限的设备上存在崩溃的风险,不能普及到计算能力较弱的设备上,迅速降低误唤醒的同时也伴随着唤醒率的降低。另一方面,降低唤醒门槛可以有效的提升唤醒率,但是同时会带来误唤醒的提升。
发明内容
本发明实施例提供一种提升唤醒性能的方法和装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种提升唤醒性能的方法,包括:以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;基于判定的疑似语音帧和非语音帧确定有效语音段;将所述有效语音段输入至自适应唤醒模型中,其中,所述自适应唤醒模型是基于收集的唤醒词正例样本和非唤醒词反例样本进行有监督地深度神经网络学习后获取的一个多分类模型;以及获取所述自适应唤醒模型的输出,基于所述输出确定是否唤醒设备。
第二方面,本发明实施例提供一种提升唤醒性能的装置,包括:注判定模块,配置为以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;有效语音段确定模块,配置为基于判定的疑似语音帧和非语音帧信号确定有效语音段;自适应唤醒模块,配置为将所述有效语音段输入至自适应唤醒模型中,其中,所述自适应唤醒模型是基于收集的唤醒词正例样本和非唤醒词反例样本进行有监督地深度神经网络学习后获取的一个二分类模型;以及结果输出模块,配置为获取所述自适应唤醒模型的输出,基于所述输出确定是否唤醒设备。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的提升唤醒性能的方法的步骤。
第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的提升唤醒性能的方法的步骤。
本申请的方法和装置提供的方案通过通过先对输入语音进行检测,确定有效语音段,然后将该有效语音段输入至预先训练的自适应唤醒模型中,进行自适应地唤醒,可以有效地提升唤醒准确度,并且由于自适应唤醒模型能够不断地收集用户的输入语音进行有监督地训练,可以使得其能够根据用户的使用场景进行有效地优化,对于使用场景比较复杂的环境唤醒准确度尤其高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910801354.9/2.html,转载请声明来源钻瓜专利网。