[发明专利]一种音频数据处理方法、装置、设备及可读存储介质在审
申请号: | 202010953505.5 | 申请日: | 2020-09-11 |
公开(公告)号: | CN111968678A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 黄羿衡;田晋川 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L13/04;G10L13/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 数据处理 方法 装置 设备 可读 存储 介质 | ||
本申请实施例公开了一种音频数据处理方法、装置、设备及可读存储介质,该方法包括:获取目标文本数据,将目标文本数据对应的文本序列输入音频合成模型,通过音频合成模型输出目标文本数据对应的人声合成音频;获取人声合成音频的音频质量评估值,将人声合成音频的音频质量评估值作为目标文本数据的质量评估标准值;质量评估标准值用于确定针对目标文本数据的待评测朗读音频的质量评测结果。采用本申请,可以降低朗读音频的阈值选取成本。
技术领域
本申请涉及计算机技术领域,尤其涉及一种音频数据处理方法、装置、设备以及可读存储介质。
背景技术
在口语评测技术中,在评判一段语音是否符合既定音素的发音规范时,主要是判断这段语音的声学得分是否超过某一阈值,可见,选取有效阈值是发音规范性判断的关键问题。
在现有技术中,对于一个文本数据的有效阈值的选取,需要收集大量的具有不同发音水平的用户的朗读音频,根据每个朗读音频的声学得分,构建统计分布,根据该朗读音频的标签对该文本数据设置阈值,这种依赖于大量的、高质量的且定制化的标注数据的阈值选取方式,成本极大。
发明内容
本申请实施例提供一种音频数据处理方法、装置、设备以及可读存储介质,可以降低朗读音频的阈值选取成本。
本申请实施例一方面提供了一种音频数据处理方法,包括:
获取目标文本数据,将目标文本数据对应的文本序列输入音频合成模型,通过音频合成模型输出目标文本数据对应的人声合成音频;音频合成模型是通过划分结果对样本音频合成模型进行调整所得到的;划分结果是指通过样本音频合成模型对标签数据分布进行划分所得到的结果;标签数据分布为第一质量评估标签与第二质量评估标签的数据分布,第一质量评估标签为样本文本数据对应的朗读音频正样本的音频质量评估值,第二质量评估标签为样本文本数据对应的朗读音频负样本的音频质量评估值;
获取人声合成音频的音频质量评估值,将人声合成音频的音频质量评估值作为目标文本数据的质量评估标准值;质量评估标准值用于确定针对目标文本数据的待评测朗读音频的质量评测结果。
本申请实施例一方面提供了一种音频数据处理装置,包括:
合成音频获取模块,用于获取目标文本数据,将目标文本数据对应的文本序列输入音频合成模型,通过音频合成模型输出目标文本数据对应的人声合成音频;音频合成模型是通过划分结果对样本音频合成模型进行调整所得到的;划分结果是指通过样本音频合成模型对标签数据分布进行划分所得到的结果;标签数据分布为第一质量评估标签与第二质量评估标签的数据分布,第一质量评估标签为样本文本数据对应的朗读音频正样本的音频质量评估值,第二质量评估标签为样本文本数据对应的朗读音频负样本的音频质量评估值;
评估值获取模块,用于获取人声合成音频的音频质量评估值;
标准值确定模块,用于将人声合成音频的音频质量评估值作为目标文本数据的质量评估标准值;质量评估标准值用于确定针对目标文本数据的待评测朗读音频的质量评测结果。
其中,评估值获取模块包括:
字典获取单元,用于获取发声字典;发声字典包括文本单词与音素序列之间的音素映射关系;
音素序列确定单元,用于通过发声字典中文本单词与音素序列之间的音素映射关系,确定目标文本数据对应的目标音素序列;
评估值确定单元,用于根据目标音素序列,确定人声合成音频的音频质量评估值。
其中,评估值确定单元包括:
状态序列获取子单元,用于通过音频评估模型,获取目标音素序列中每个音素对应的音素状态有向序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010953505.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钻头高效清洁方法
- 下一篇:一种防晒乳及其制备方法