[发明专利]一种批量测试语音识别和文本合成的方法和测试系统有效
申请号: | 201811087317.8 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109326305B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 廖志梁;陶亮;王道宁;张亚东;马立民 | 申请(专利权)人: | 易诚博睿(南京)科技有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L15/01;G10L13/02 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 黄雪 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种批量测试语音识别和文本合成的方法和测试系统,所述方法包括以下步骤:(1)将现有ASR与TTS技术的jar包(so包)集成到测试系统;(2)选择待测试的功能;(3)根据所选择的待测试功能将PC中已配置好的Config配置文件push到测试设备;(4)检查配置文件中的信息;(5)功能测试;(6)运行对应脚本进行结果计算,并与对应的标准测试结果进行对比;所述测试系统包括控制模块,以及存储模块、输入模块、文件发送模块、语音输出模块、文件接收模块、测试比较模块和测试结果输出模块等技术特征。本发明整合了语音识别和文本合成从送测试数据到结果统计的整个流程,极大地提高了工作效率。 | ||
搜索关键词: | 一种 批量 测试 语音 识别 文本 合成 方法 系统 | ||
【主权项】:
1.一种批量测试语音识别和文本合成的方法,其特征在于,包括以下步骤:步骤1、将现有ASR与TTS技术的jar包或so包集成到测试系统;步骤2、启动测试脚本,根据测试设备的序列号选择待测试的功能,所述供选择的待测试的功能包括ASR功能,TTS功能;当输入不正确的值时提示输入值不正确,弹出提示要求输入正确的值;步骤3、根据所选择的待测试功能将PC中已配置好的Config配置文件推送/拷贝到测试设备;当本地配置文件不存在时提醒配置文件不存在停止运行;步骤4、启动测试系统,读取测试系统中存储的配置文件,并检查配置文件中的信息是否正常,当配置文件不正确时打印错误信息并停止运行;步骤5、配置文件检查通过后,开始进行对应的功能测试;步骤5.1、ASR功能测试步骤5.1.1、根据配置文件中的语音识别模式和语音信息获取语音识别模式以及语音数据文件,将语音数据文件进行播放形成语音,待测系统将接收的语音按照实际使用情况进行分割分段送入语音识别系统的app进行识别;如果语音识别模式是识别则进入识别模式,如果语音识别模式是唤醒则进行唤醒模式;所述语音数据文件采用的是已经录制好的16K或48k的wav或pcm格式的语音数据;步骤5.1.2、当有识别或唤醒的结果返回时,获取识别或唤醒结果,并保存到测试设备;当语音识别错误无结果返回时,使用空值并保存相关信息;步骤5.2 TTS功能测试步骤5.2.1、根据配置文件中TTS文本信息,前端模型,后端模型信息,加载TTS相关的信息到文本合成系统的app中,然后将文本信息送入进行合成;当合成失败时打印合成失败的信息,再继续合成下一条数据;步骤5.2.2、文本合成之后,获取文本合成的语音保存到测试设备,将合成的语音再进行ASR语音识别;步骤5.2.3、获取经TTS合成后语音的ASR语音识别结果保存到本地,并运行对应脚本进行结果计算;步骤6、所选择的测试功能均测试完毕后,将ASR测试中间结果保存到PC,运行对应脚本进行结果计算,并与对应的标准测试结果进行对比;步骤6.1、ASR功能结果处理并保存步骤6.1.1、识别功能:通过标准文本的格式判断语音是长语音还是短语音,然后将识别的结果与标准文本进行对比,获取到本次识别结果的字错误率WER、句错误率SER或者词错误率;步骤6.1.2、唤醒功能:通过语音集信息判断是正常唤醒还是误唤醒,如果是正常唤醒,将正常唤醒的测试结果与标准文本进行对比,剔除误唤醒数据,得到唤醒率;如果是误唤醒,根据误唤醒测试得到数据及时长,得到单位时间内的误唤醒值;得到测试结果后将测试结果按照测试的文件名加时间进行保存,再将步骤3~6重复一遍后,进行下一轮测试;步骤6.2、TTS功能以及后处理步骤6.2.1、将TTS功能识别后的结果保存到PC上,然后与送入TTS进行合成的原始文本进行对比,将TTS进行合成的原始文本中与经ASR语音识别后结果不同的内容,进行保存,再将步骤3~6重复一遍后,进行下一轮测试;步骤6.2.2、将步骤6.2.1的语音识别结果与步骤5.1.2中的ASR结果进行对比,判断是否有不一致的结果;步骤6.2.3、挑出所有不一致的语音文件id或文本文件id;步骤6.2.4、根据两次识别不一致的结果进行分析,判断具体问题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易诚博睿(南京)科技有限公司,未经易诚博睿(南京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811087317.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种语音分离方法及系统
- 下一篇:光盘流式刻录方法