[发明专利]唤醒语音确定方法、装置、设备及介质有效
申请号: | 202010992171.2 | 申请日: | 2020-09-21 |
公开(公告)号: | CN111933112B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 靳源;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L25/51 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢少真 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 语音 确定 方法 装置 设备 介质 | ||
1.一种唤醒语音确定方法,其特征在于,所述方法包括:
对待处理语音进行特征提取,得到所述待处理语音的第一语音特征;
对所述第一语音特征进行分类,得到分类结果;
响应于所述分类结果指示所述待处理语音为唤醒语音,基于所述分类结果,获取第二语音特征;
对所述第二语音特征进行插值处理,得到第三语音特征,所述第三语音特征的长度为目标长度;
对所述第三语音特征进行分类,确定所述待处理语音是否为唤醒语音。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一语音特征进行分类,得到分类结果,包括:
对所述第一语音特征进行识别,得到每个第一语音特征对应的音素;
基于所述第一语音特征的识别结果,对所述第一语音特征进行分类,得到所述分类结果。
3.根据权利要求1所述的方法,其特征在于,分类结果包括所述待处理语音为唤醒语音的置信度和所述第一语音特征中唤醒词的目标路径;
所述响应于所述分类结果指示所述待处理语音为唤醒语音,基于所述分类结果,获取第二语音特征,包括下述任一项:
响应于所述置信度大于置信度阈值,基于所述分类结果中所述目标路径,确定第一长度;基于所述第一长度,对所述第一语音特征进行截取,得到所述第二语音特征;
响应于所述置信度大于置信度阈值,基于所述分类结果中所述目标路径,确定第一长度;基于所述第一长度,从所述待处理语音中截取所述第一长度的语音;对所述截取得到的语音进行特征提取,得到所述第二语音特征。
4.根据权利要求1所述的方法,其特征在于,所述对所述第一语音特征进行分类,得到分类结果,包括:
将所述第一语音特征输入语音处理模型中,由所述语音处理模型执行分类步骤输出所述分类结果;
所述对所述第三语音特征进行分类,确定所述待处理语音是否为唤醒语音,包括:
将所述第三语音特征输入所述语音处理模型中,由所述语音处理模型执行对第三语音特征的分类步骤,确定所述待处理语音是否为唤醒语音。
5.根据权利要求4所述的方法,其特征在于,所述语音处理模型包括第一语音处理模块和第二语音处理模块;所述第一语音处理模块用于执行所述分类步骤,输出所述分类结果;所述第二语音处理模块用于执行对第三语音特征的分类步骤,确定所述待处理语音是否为唤醒语音。
6.根据权利要求5所述的方法,其特征在于,所述语音处理模型的训练过程包括:
获取样本语音以及样本语音对应的目标分类结果,所述目标分类结果用于指示所述样本语音是否为唤醒语音;
对所述样本语音进行特征提取,得到第一语音特征;
基于所述第一语音特征和所述目标分类结果,分别对所述语音处理模型中所述第一语音处理模块和所述第二语音处理模块进行训练,得到训练好的第一语音处理模块和第二语音处理模块。
7.根据权利要求6所述的方法,其特征在于,所述第一语音处理模块的训练过程包括:
将所述第一语音特征输入语音识别模型中,由所述语音识别模型对所述第一语音特征进行识别,得到所述第一语音特征对应的目标识别结果;
将所述第一语音特征输入语音处理模型的第一语音处理模块中,由所述第一语音处理模块对第一语音特征进行识别,基于识别得到的音素进行分类,得到第一预测分类结果;
根据所述第一预测分类结果、所述目标分类结果、识别得到的音素以及目标识别结果,对所述第一语音处理模块的模型参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010992171.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发声模组
- 下一篇:一种CuCr合金电工触头专用金属铬粉的制备方法