[发明专利]语音合成数据的质检方法以及装置有效

专利信息
申请号: 202110562516.5 申请日: 2021-05-24
公开(公告)号: CN113035236B 公开(公告)日: 2021-08-27
发明(设计)人: 张晴晴;朱冬;张雪璐;贾艳明 申请(专利权)人: 北京爱数智慧科技有限公司
主分类号: G10L25/51 分类号: G10L25/51;G10L15/26;G10L15/16;G10L13/02
代理公司: 北京智沃律师事务所 11620 代理人: 吴志宏
地址: 100088 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 合成 数据 质检 方法 以及 装置
【说明书】:

本申请公开了一种语音合成数据的质检方法以及装置,属于语音合成领域,质检方法包括:根据原始文本,使用不同的语音合成方式合成多条目标音频;通过ASR模型对多条目标音频进行识别,得到各自的识别文本;在识别文本与原始文本不一致的情况下,判断识别文本对应的目标音频不合格;在识别文本与原始文本一致的情况下,判断识别文本对应的目标音频初步合格;通过端到端的判别模型输出每个初步合格的目标音频的对齐后的音素的概率值;根据音素的概率值进行音素的发音打分;通过回归模型将音素的得分转化为相应的句子的得分;在句子的得分高于阈值的情况下,判断句子对应的目标音频合格,并将得分最高的句子对应的目标音频判断为最佳音频。

技术领域

本申请属于语音合成技术领域,具体涉及一种语音合成数据的质检方法以及装置。

背景技术

语音合成是一种将文本转换为语音的技术,即将给定文字按需求转换为语音进行输出。在竞争日趋激烈的市场环境对运用语音合成技术提供服务时提出了更高的要求,即合成的语音达到真人发声的效果。具体来说,第一点合成的语音不能缺字或多字,第二点合成的语音发音不能出现音素缺失或音素发音错误,第三点合成的语音虽然整体正确但存在缺陷。如何保证语音合成系统在广泛场景下都能得到高质量的合成语音是一项具有挑战的任务。

此外随着硬件设备、算力和用于语音合成建模数据质量提升,语音合成技术也从传统的前端和后端两个模块结合,发展到了端到端的语音合成。目前关于语音合成效果的评判,通常采用专家级评测MOS(Mean Opinion Scores)或者普通用户评测ABX,即专家对合成的音频打分或普通用户对比不同语音合成系统对同一段文字的合成效果。

发明人发现现有技术当前至少存在以下问题:即时使用先进的端到端的语音合成技术,加专家级或普通用户级的评测,也不能百分百保证通过评测的语音合成系统合成的语音质量,即可能存在听感上漏字、发音缺失、发音错误或者发音正确但不符合人的听感的现象。采用人工质检效率低下,并且难以保证质检的质量。

发明内容

本申请实施例的目的是提供一种语音合成数据的质检方法和装置,能够解决目前对于语音合成数据采用人工质检时效率低下,并且难以保证质检质量的问题。同时克服传统发音质量评价特征提取过程复杂的问题,并提高所得评分与发音的相关性。

为了解决上述技术问题,本申请是这样实现的:

第一方面,本申请实施例提供了一种语音合成数据的质检方法,包括:

根据原始文本,使用不同的语音合成方式合成多条目标音频;

通过ASR模型对多条所述目标音频进行识别,得到各自的识别文本;

在所述识别文本与所述原始文本不一致的情况下,判断所述识别文本对应的所述目标音频不合格;

在所述识别文本与所述原始文本一致的情况下,判断所述识别文本对应的所述目标音频初步合格;

通过端到端的判别模型输出每个初步合格的所述目标音频的对齐后的音素的概率值;

根据所述音素的概率值进行所述音素的发音打分;

通过回归模型将所述音素的得分转化为相应的句子的得分;

在所述句子的得分高于阈值的情况下,判断所述句子对应的所述目标音频合格,并将得分最高的所述句子对应的所述目标音频判断为最佳音频。

进一步地,所述ASR模型包括:声学模型、语音模型以及词典,其中,所述声学模型采用真人语音以及合成语音进行共同训练得到,所述语音模型通过通用语言模型与各领域模型进行插值得到。

进一步地,所述判别模型采用CTC+Attention相结合的技术训练得到。

进一步地,所述方法还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱数智慧科技有限公司,未经北京爱数智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110562516.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top