[发明专利]一种基于批量语音识别和TTS文本合成的测试方法有效
申请号: | 201810900486.2 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109147761B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 廖志梁;陶亮;王道宁;张亚东;马立民 | 申请(专利权)人: | 北京易诚高科科技发展有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L13/02;G10L15/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100035 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 批量 语音 识别 tts 文本 合成 测试 方法 | ||
1.一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,具体步骤包括:
步骤1、通过PC或云端启动测试脚本,根据待测智能终端选择要测试的功能,包括ASR功能或TTS功能;
步骤2、推送PC或云端已配置好的系统配置文件和集成了ASR及TTS技术的测试APP到待测智能终端;
步骤3、自动启动待测智能终端上的测试APP,根据系统配置文件调配测试ASR功能或TTS功能相关支持文件并存储在待测智能终端中,测试ASR功能支持文件包括识别语音信息、标准文本和语音识别模式,语音识别模式包括识别和唤醒两种模式;测试TTS功能支持文件包括TTS合成文本信息、TTS前端模型和TTS后端模型;
步骤4、如测试ASR功能:识别语音信息根据语音识别模式对获取的语音数据进行分割,并分段送入测试APP识别,根据识别或者唤醒模式,获取识别或唤醒结果,并将识别或唤醒结果保存到待测智能终端中;
如测试TTS功能:根据TTS文本信息、TTS前端模型和TTS后端模型将待测文本信息送入进行合成,如文本合成成功,获取文本合成语音保存到待测智能终端中,然后将文本合成语音再进行ASR语音识别,获取语音识别后的ASR语音识别结果并保存到待测智能终端中;如文本合成失败,保存文本合成时的参数信息及合成失败的目标文本,再继续合成下一条数据,直至全部文本合成完成;
步骤5、PC或云端自动获取步骤4中存储在待测智能终端中的结果;或,通过PC或云端手动获取步骤4中存储在待测智能终端中的结果,并保存到PC或云端,与相应的标准文本或待测文本信息进行结果比对,包括:
测试ASR功能结果比对:
如为识别模式,通过标准文本格式判断语音是长语音还是短语音,然后将识别结果与标准文本进行比对,获取本次识别结果的字错误率、句错误率或者词错误率,形成比对结果;
如为唤醒模式,判断是正常唤醒还是误唤醒,计算正常唤醒下的唤醒率或者误唤醒下的误唤醒率,形成计算后的比对结果;
测试TTS功能结果比对:
将待测文本信息与经TTS文本合成、再经ASR语音识别后的结果进行比对,形成不同内容的比对结果;
最后,将比对结果按照测试文件名加时间的方式保存在PC或云端,完成待测智能终端批量语音识别和TTS文本合成的测试过程。
2.根据权利要求1所述的一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,所述步骤4中保存到待测智能终端的识别结果包括:当前进行识别的语音文件路径加文件名、语音开始识别时间、语音结束识别时间和语音识别结果。
3.根据权利要求1所述的一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,所述步骤4中保存到待测智能终端的唤醒结果包括:当前进行识别的语音文件路径加文件名、语音开始唤醒时间、语音结束唤醒时间、语音唤醒结果、第几次唤醒和唤醒个数统计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易诚高科科技发展有限公司,未经北京易诚高科科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810900486.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:合成语音的方法、装置、系统及设备
- 下一篇:一种语音识别方法及系统