[发明专利]一种离线语音增强方法及系统在审
申请号: | 202010742887.7 | 申请日: | 2020-07-29 |
公开(公告)号: | CN114067815A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 李兴伟;袁志俊;王恺;李想 | 申请(专利权)人: | 斑马智行网络(香港)有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L21/02;G10L21/0308 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 段洁汝 |
地址: | 中国香港九龙长沙湾道*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离线 语音 增强 方法 系统 | ||
本发明公开了一种离线语音增强方法及系统。其中,离线语音增强方法包括步骤:确定离线语音识别的阈值参数;在阈值参数下,对接收到的语音进行离线识别,得到增强后的识别结果。本发明一并公开了相应的确定离线语音识别的阈值参数的方法和语音测试系统。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种离线语音增强方法及系统。
背景技术
当下,智能设备的应用越来越普及,用户通过语音来控制智能设备,极大地丰富了用户的体验。其中,绝大多数智能设备的工作必须依赖于网络。在常见的应用场景中,智能设备连接到网络,通过网络将用户的语音上传至云端的语音识别系统,以获取在线识别的内容服务。一旦离开网络,这些智能设备的使用就会受到影响,给用户带来不好的使用体验。
然而,针对一些处于移动状态的智能设备,其在工作时并不易于接入网络,例如,布置在车辆上的语音交互设备。此时,在智能设备上设置离线语音交互方案,就显得十分必要。离线语音交互方案,即无需WIFI、APP,直接用本地指令集对设备进行操控的语音识别。
以布置在车辆上的语音交互系统为例,目前传统的离线语音识别方案,往往需要针对各车型的功能和业务特点做定制。即,需要语音交互系统提供商为各种车型做离线语法的定制、以及各种参数的调优,这势必会导致较大的投入成本和研发周期。
鉴于此,需要一种新的离线语音增强方案。
发明内容
为此,本发明提供了一种离线语音增强方法及系统,以力图解决或至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种确定离线语音识别的阈值参数的方法,包括步骤:利用预置的语法,生成语音测试集;基于语音测试集,获取音频信息;通过对所获取的音频信息进行测试,输出包含识别指标的测试结果;以及根据识别指标的测试结果,确定出离线语音识别的阈值参数。
可选地,根据本发明的方法还包括步骤:设置离线语法;对离线语法进行处理,得到预置的语法;以及利用预置的语法,生成语音测试集。
可选地,在根据本发明的方法中,设置离线语法的步骤包括:基于语法定制格式,生成定制语法;将定制语法与基础语法相融合,得到离线语法。
可选地,根据本发明的方法还包括步骤:基于语音测试集,在不同测试环境下得到实时录制的至少一条音频信息;将至少一条音频信息进行混音,作为所获取的音频信息。
可选地,根据本发明的方法还包括步骤:在通过对所获取的音频信息进行测试,输出包含识别指标的测试结果的步骤之前,校验所获取的音频信息的有效性。
可选地,根据本发明的方法还包括步骤:对所获取的音频信息进行识别,得到识别结果;基于测试配置与所述识别结果,确定不同阈值下对应的识别指标的测试结果。
可选地,在根据本发明的方法中,识别指标至少包含以下指标中的一个:识别率、拒识率、最大等待时长。
可选地,在根据本发明的方法中,测试环境至少包括以下环境中的一种:安静环境和噪音环境。
根据本发明的另一个方面,提供了一种离线语音增强方法,包括步骤:确定离线语音识别的阈值参数;在阈值参数下,对接收到的语音进行离线识别,得到增强后的识别结果。其中,阈值参数通过执行如上所述的确定离线语音识别的阈值参数的方法来确定。
根据本发明的再一个方面,提供了一种语音测试系统,包括:测试集生成单元,适于利用预置的语法,生成语音测试集;音频获取单元,适于基于语音测试集,获取音频信息;测试单元,适于通过对所获取的音频信息进行测试,输出包含识别指标的测试结果;以及阈值调节单元,适于根据识别指标的测试结果,确定出离线语音识别的阈值参数。
可选地,根据本发明的语音测试系统还包括语法定制单元,适于设置离线语法,并对离线语法进行处理,得到预置的语法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斑马智行网络(香港)有限公司,未经斑马智行网络(香港)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010742887.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于互动式的知识蒸馏方法
- 下一篇:物联网电箱