[发明专利]一种批量测试语音识别和文本合成的方法和测试系统有效
申请号: | 201811087317.8 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109326305B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 廖志梁;陶亮;王道宁;张亚东;马立民 | 申请(专利权)人: | 易诚博睿(南京)科技有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L15/01;G10L13/02 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 黄雪 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 测试 语音 识别 文本 合成 方法 系统 | ||
本发明涉及一种批量测试语音识别和文本合成的方法和测试系统,所述方法包括以下步骤:(1)将现有ASR与TTS技术的jar包(so包)集成到测试系统;(2)选择待测试的功能;(3)根据所选择的待测试功能将PC中已配置好的Config配置文件push到测试设备;(4)检查配置文件中的信息;(5)功能测试;(6)运行对应脚本进行结果计算,并与对应的标准测试结果进行对比;所述测试系统包括控制模块,以及存储模块、输入模块、文件发送模块、语音输出模块、文件接收模块、测试比较模块和测试结果输出模块等技术特征。本发明整合了语音识别和文本合成从送测试数据到结果统计的整个流程,极大地提高了工作效率。
技术领域
本发明属于测试方法和系统相关领域,具体涉及一种批量测试语音识别和文本合成的方法和测试系统。
背景技术
随着语音技术的成熟,很多通过语音进行控制的智能音箱,手机语音助手,智能家居,智能汽车等产品越来越多,基于语音进行设备控制更为方便,体验上更具有优势。然而对于语音识别的产品测试也成了一个难点,目前对于大批量语音识别的测试,TTS文本合成的测试没有一个完整的测试方法及测试工具,因此,只能将语音识别和文字转语音的割裂开来进行测试;举个例子如果想要判断文字识别后的发音是否正确,只能先把语音输入测试一遍文字识别ASR,然后把识别对的文字送给TTS做测试;另外TTS的测试现阶段更多的还是靠人耳去听,是不是读错了,是不是有停顿,是不是直接没有读等等;而靠人耳进行听则非常耗费时间和人力进行人工判断。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种批量测试语音识别和文本合成的方法和测试工具。
为了实现上述目的,本发明采取的技术方案如下:
技术方案一:
一种批量测试语音识别和文本合成的方法,包括以下步骤:
步骤1、将现有ASR与TTS技术的jar包或so包集成到测试系统;
步骤2、启动测试脚本,根据测试设备的序列号选择待测试的功能,所述供选择的待测试的功能包括ASR功能,TTS功能;当输入不正确的值时提示输入值不正确,弹出提示要求输入正确的值;
步骤3、根据所选择的待测试功能将PC中已配置好的Config配置文件推送/拷贝到测试设备;当本地配置文件不存在时提醒配置文件不存在停止运行;
步骤4、启动测试系统,读取测试系统中存储的配置文件,并检查配置文件中的信息是否正常,当配置文件不正确时打印错误信息并停止运行;
步骤5、配置文件检查通过后,开始进行对应的功能测试;
步骤5.1、ASR功能测试
步骤5.1.1、根据配置文件中的语音识别模式和语音信息获取语音识别模式以及语音数据文件,将语音数据文件进行播放形成语音,待测系统将接收的语音按照实际使用情况进行分割分段送入语音识别系统的app进行识别;如果语音识别模式是识别则进入识别模式,如果语音识别模式是唤醒则进行唤醒模式;所述语音数据文件采用的是已经录制好的16K或48k的wav或pcm格式的语音数据;
步骤5.1.2、当有识别或唤醒的结果返回时,获取识别或唤醒结果,并保存到测试设备;当语音识别错误无结果返回时,使用空值并保存相关信息。
步骤5.2 TTS功能测试
步骤5.2.1、根据配置文件中TTS文本信息,前端模型,后端模型信息,加载TTS相关的信息到文本合成系统的app中,然后将文本信息送入进行合成;当合成失败时打印合成失败的信息,再继续合成下一条数据;
步骤5.2.2、文本合成之后,获取文本合成的语音保存到测试设备,将合成的语音再进行ASR语音识别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易诚博睿(南京)科技有限公司,未经易诚博睿(南京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811087317.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音分离方法及系统
- 下一篇:光盘流式刻录方法