[发明专利]一种离线语音增强方法及系统在审
申请号: | 202010742887.7 | 申请日: | 2020-07-29 |
公开(公告)号: | CN114067815A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 李兴伟;袁志俊;王恺;李想 | 申请(专利权)人: | 斑马智行网络(香港)有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L21/02;G10L21/0308 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 段洁汝 |
地址: | 中国香港九龙长沙湾道*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离线 语音 增强 方法 系统 | ||
1.一种确定离线语音识别的阈值参数的方法,包括步骤:
利用预置的语法,生成语音测试集;
基于所述语音测试集,获取音频信息;
通过对所获取的音频信息进行测试,输出包含识别指标的测试结果;以及
根据所述识别指标的测试结果,确定出离线语音识别的阈值参数。
2.如权利要求1所述的方法,其中,所述利用预置的语法,生成语音测试集的步骤包括:
设置离线语法;
对所述离线语法进行处理,得到预置的语法;以及
利用预置的语法,生成语音测试集。
3.如权利要求2所述的方法,其中,所述设置离线语法的步骤包括:
基于语法定制格式,生成定制语法;
将所述定制语法与基础语法相融合,得到离线语法。
4.如权利要求1所述的方法,其中,所述基于语音测试集,获取音频信息的步骤包括:
基于所述语音测试集,在不同测试环境下得到实时录制的至少一条音频信息;
将所述至少一条音频信息进行混音,作为所获取的音频信息。
5.如权利要求1-4中任一项所述的方法,其中,在所述通过对所获取的音频信息进行测试,输出包含识别指标的测试结果的步骤之前,还包括步骤:
校验所获取的音频信息的有效性。
6.如权利要求5所述的方法,其中,所述通过对所获取的音频信息进行测试,输出包含识别指标的测试结果的步骤包括:
对所获取的音频信息进行识别,得到识别结果;
基于测试配置与所述识别结果,确定不同阈值下对应的识别指标的测试结果。
7.如权利要求6所述的方法,其中,所述识别指标至少包含以下指标中的一个:识别率、拒识率、最大等待时长。
8.如权利要求4所述的方法,其中,所述测试环境至少包括以下环境中的一种:安静环境和噪音环境。
9.一种离线语音增强方法,包括步骤:
确定离线语音识别的阈值参数;
在所述阈值参数下,对接收到的语音进行离线识别,得到增强后的识别结果。
10.如权利要求9所述的方法,其中,所述阈值参数通过执行如权利要求1-8中任一项所述的方法来确定。
11.一种语音测试系统,包括:
测试集生成单元,适于利用预置的语法,生成语音测试集;
音频获取单元,适于基于所述语音测试集,获取音频信息;
测试单元,适于通过对所获取的音频信息进行测试,输出包含识别指标的测试结果;以及
阈值调节单元,适于根据所述识别指标的测试结果,确定出离线语音识别的阈值参数。
12.如权利要求11所述的语音测试系统,还包括:
语法定制单元,适于设置离线语法,并对所述离线语法进行处理,得到预置的语法。
13.如权利要求11或12所述的语音测试系统,其中,所述测试单元包括:
识别子单元,适于对所获取的音频信息进行识别,得到识别结果;
计算子单元,适于基于测试配置与所述识别结果,确定不同阈值下对应的识别指标的测试结果。
14.如权利要求13所述的语音测试系统,其中,所述测试单元还包括:
校验子单元,适于校验所获取的音频信息的有效性。
15.一种语音增强系统,包括:
如权利要求11-14中任一项所述的语音测试系统,适于确定离线语音识别的阈值参数;
增强识别单元,适于在所述阈值参数下,对接收到的离线语音进行识别,得到增强后的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斑马智行网络(香港)有限公司,未经斑马智行网络(香港)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010742887.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于互动式的知识蒸馏方法
- 下一篇:物联网电箱