[发明专利]一种基于批量语音识别和TTS文本合成的测试方法有效
申请号: | 201810900486.2 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109147761B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 廖志梁;陶亮;王道宁;张亚东;马立民 | 申请(专利权)人: | 北京易诚高科科技发展有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L13/02;G10L15/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100035 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于批量语音识别和TTS文本合成的测试方法,通过在待测智能终端中建立软件环境并自动运行测试APP,完成待测智能终端上ASR功能测试和TTS功能测试,并在TTS功能测试后再进行ASR反向语音识别功能测试,最终形成明确、可靠的比对结果,为后期改进和提高待测智能终端中的智能语音系统提供帮助。其测试方式整合了语音识别和文本合成从送测试数据到结果统计的整个流程,覆盖了语音识别和TTS文本合成的多场景测试,提高了语音识别测试速度和测试范围,确保了后期智能终端语音识别使用环境的适用性和可靠性,测试过程灵活,可随时随地对各种智能终端进行智能语音控制系统测试。 | ||
搜索关键词: | 一种 基于 批量 语音 识别 tts 文本 合成 测试 方法 | ||
【主权项】:
1.一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,具体步骤包括:步骤1、通过PC或云端启动测试脚本,根据待测智能终端选择要测试的功能,包括ASR功能或TTS功能;步骤2、推送PC或云端已配置好的系统配置文件和集成了ASR及TTS技术的测试APP到待测智能终端;步骤3、自动启动待测智能终端上的测试APP,根据系统配置文件调配测试ASR功能或TTS功能相关支持文件并存储在待测智能终端中,测试ASR功能支持文件包括识别语音信息、标准文本和语音识别模式,语音识别模式包括识别和唤醒两种模式;测试TTS功能支持文件包括TTS合成文本信息、TTS前端模型和TTS后端模型;步骤4、如测试ASR功能:识别语音信息根据语音识别模式对获取的语音数据进行分割,并分段送入测试APP识别,根据识别或者唤醒模式,获取识别或唤醒结果,并将识别或唤醒结果保存到待测智能终端中;如测试TTS功能:根据TTS文本信息、TTS前端模型和TTS后端模型将待测文本信息送入进行合成,如文本合成成功,获取文本合成语音保存到待测智能终端中,然后将文本合成语音再进行ASR语音识别,获取语音识别后的ASR语音识别结果并保存到待测智能终端中;如文本合成失败,保存文本合成时的参数信息及合成失败的目标文本,再继续合成下一条数据,直至全部文本合成完成;步骤5、PC或云端自动获取步骤4中存储在待测智能终端中的结果;或,通过PC或云端手动获取步骤4中存储在待测智能终端中的结果,并保存到PC或云端,与相应的标准文本或待测文本信息进行结果比对,包括:测试ASR功能结果比对:如为识别模式,通过标准文本格式判断语音是长语音还是短语音,然后将识别结果与标准文本进行比对,获取本次识别结果的字错误率、句错误率或者词错误率,形成比对结果;如为唤醒模式,判断是正常唤醒还是误唤醒,计算正常唤醒下的唤醒率或者误唤醒下的误唤醒率,形成计算后的比对结果;测试TTS功能结果比对:将待测文本信息与经TTS文本合成、再经ASR语音识别后的结果进行比对,形成不同内容的比对结果;最后,将比对结果按照测试文件名加时间的方式保存在PC或云端,完成待测智能终端批量语音识别和TTS文本合成的测试过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易诚高科科技发展有限公司,未经北京易诚高科科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810900486.2/,转载请声明来源钻瓜专利网。
- 上一篇:合成语音的方法、装置、系统及设备
- 下一篇:一种语音识别方法及系统