[发明专利]语音合成的效果评估方法、装置、计算机设备及存储介质有效
申请号: | 202011485821.0 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112669810B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 陈婷;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L25/51;G10L25/90 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 效果 评估 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音合成的效果评估方法,其特征在于,所述方法包括:
若接收到用户所输入的测试文本集,从预存的样本数据库中获取能够完整覆盖所述测试文本集的样本数据集合,所述样本数据集合的每一样本数据均包括文本信息及与所述文本信息相匹配的语音信息;所述样本数据库的样本数据中包含文本信息及对应的语音信息,所述语音信息包括中文语音信息,所述文本信息包括与所述中文语音信息对应的中文文本信息;
根据预存的编码词典获取与所述样本数据集合中每一文本信息对应的文本编码序列;
根据预置的提取规则从所述样本数据集合中与每一所述文本信息相匹配的语音信息中提取得到音频系数信息;
根据预置的合成模型构建规则、所述文本编码序列及所述音频系数信息构建对应的音频合成模型;
根据预置的预测模型构建规则、所述语音信息及与所述文本信息对应的韵律信息构建韵律预测模型;
若接收到用户所输入的测试信息,根据所述音频合成模型及所述韵律预测模型对所述测试信息的文本信息进行语音合成处理得到语音合成信息;
根据所述测试信息中测试数据的目标频谱信息对所述语音合成信息的音频合成信息进行对比评估得到第一评估结果;
根据所述测试信息中测试数据的目标韵律信息对所述语音合成信息的韵律预测信息进行对比评估得到第二评估结果;
所述编码词典包括文本解析词典、文本标注规则及转换词典,所述根据预存的编码词典获取与所述样本数据集合中每一文本信息对应的文本编码序列,包括:
根据所述文本解析词典及所述文本标注规则获取与所述样本数据集合中每一文本信息对应的文本标注信息;
根据预置的转换词典对所述文本标注信息进行转换得到对应的文本编码信息;
将所述文本标注信息包含的字符标注信息与所述文本编码信息包含的文本编码值一一组合得到对应的多个文本编码序列;
所述提取规则包括频谱转换规则、频率转换公式及逆变换规则,所述根据预置的提取规则从所述样本数据集合中与每一所述文本信息相匹配的语音信息中提取得到音频系数信息,包括:
对所述语音信息进行分帧处理得到对应的多帧音频信息;
根据预置的单位时间及所述频谱转换规则将每一所述单位时间内包含的所述音频信息转换为对应的音频频谱;
根据所述频率转换公式将每一所述音频频谱转换为对应的非线性音频频谱;
根据所述逆变换规则对每一所述非线性音频频谱进行逆变换得到与每一所述非线性音频频谱对应的多个音频系数作为所述音频系数信息;
所述第一评估结果包括准确率统计结果及路径距离统计结果,所述根据所述测试信息中测试数据的目标频谱信息对所述语音合成信息的音频合成信息进行对比评估得到第一评估结果,包括:
根据所述测试信息中测试数据的目标频谱信息对所述音频合成信息进行准确率统计,得到所述准确率统计结果;
获取所述测试数据中目标频谱信息与所述音频合成信息不一致的差异路径;
计算所述差异路径的编辑距离并进行统计得到所述路径距离统计结果;
所述根据所述测试信息中测试数据的目标韵律信息对所述语音合成信息的韵律预测信息进行对比评估得到第二评估结果,包括:
获取所述目标韵律信息与所述韵律预测信息相同的字符的占比,以统计得到字符韵律准确率;
获取所述目标韵律信息与所述韵律预测信息相同的测试数据的占比,以统计得到语句韵律准确率;
将所述字符韵律准确率及所述语句韵律准确率作为所得到的第二评估结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011485821.0/1.html,转载请声明来源钻瓜专利网。