[发明专利]语料库优化方法及装置有效

专利信息
申请号: 201811269819.2 申请日: 2018-10-29
公开(公告)号: CN109389969B 公开(公告)日: 2020-05-26
发明(设计)人: 祝晓林;盖于涛;周志平 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G10L13/02 分类号: G10L13/02;G10L15/14;G06F16/68
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 荣甜甜;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语料库 优化 方法 装置
【说明书】:

发明实施例提供一种语料库优化方法及装置,对于第一音频中的瑕疵音,从语料库中确定出该瑕疵音对应的第一声音片段,然后将语料库中的第一声音片段标记为非法声音片段,后续合成音频的过程中,仅从语料库中合法声音片段中选择候选声音片段,进而从候选声音片段中选择出最优声音片段,对最优声音片段进行波形拼接得到合成音频。该过程中,通过对语料库中的声音片段进行标记实现对语料库的优化,无需修改代码,优化过程简单且成本低。

技术领域

本发明实施例涉及智能信息处理技术领域,尤其涉及一种语料库优化方法及装置。

背景技术

语音合成,也称之为文语转换(text to speech)技术,是用于将文字信息转换为可听的声音信息的技术。基于波形拼接的语音合成方法是目前主流的语音合成方法。

基于波形拼接的语音合成方法中,根据语言学特征和声学参数,针对待合成文本的每个文本片段,利用合成算法从预先录制好并标注好的语料库中选择候选声音片段,然后根据合成算法计算候选声音片段的目标代价和链接代价从而选择出最优声音片段,然后对最优声音片段的音量或语速等进行调整,最终将调整后的最优声音片段拼接起来,得到合成音频。其中,语言学特征是对前端文本分析得到的,声学参数是通过声学模型预测并输出的,语料库中存储大量以音素或字为单位的声音片段,以及每个声音片段对应的文本信息和标注信息等,该些大量的声音片段是根据某个发音人的录音得到的,不同的发音人对应不同的语料库。由于合成音频是由语料库中的声音片段拼接得到的,因此通过该方法得到的合成音频的音质较高。然而,该基于波形拼接的语音合成过程中,语料库中预先存储的声音片段中可能包含发音不准或发音错误的声音片段,语音合成过程中选择声音片段时,若命中的声音片段的发音有问题,则会导致合成包含瑕疵音的合成音频。为避免出现瑕疵音,通过改进合成算法对语料库进行优化。合成算法主要包括预选算法和动态规划算法。针对某个文本片段,对预选算法进行改进,使得得分较低的声音片段在选择候选声音片段阶段被提前删除;对动态规划算法进行改进,从而对候选声音片段之间的目标代价以及连接代价权重进行微调以命中不同的声音片段。

上述语料库优化过程中,需要是对合成算法进行改进,过程复杂、且成本高。

发明内容

本发明提供一种语料库优化方法及装置,出现瑕疵音时,根据位置信息,确定出瑕疵音对应的声音片段,将该声音片段标记为非法声音片段,避免后续合语音合成时使用瑕疵音对应的声音片段进行语音合成,降低优化语料库的复杂度和成本,同时实现提高语音合成准确性的目的。

第一方面,本发明实施例提供一种语料库优化方法,该方法包括:

从语料库中确定出第一音频中的瑕疵音对应的第一声音片段,所述第一音频是对第一文本进行波形拼接得到的;

将所述第一声音片段标记为非法声音片段,所述非法声音片段为语音合成过程中不会命中的声音片段。

一种可行的设计中,所述从语料库中确定出第一音频中的瑕疵音对应的第一声音片段之前,还包括:

根据第一文本片段,从所述语料库中确定出所述第一声音片段,所述第一文本片段包含在所述第一文本中;

确定所述第一声音片段在所述语料库中的位置,得到位置信息;

对所述第一声音片段进行波形拼接,得到所述第一音频。

一种可行的设计中,所述从语料库中确定出第一音频中的瑕疵音对应的第一声音片段,包括:

根据所述瑕疵音对应的第一声音片段的所述位置信息,从所述语料库中确定出所述第一声音片段。

一种可行的设计中,所述根据第一文本片段,从所述语料库中确定出所述第一声音片段,包括:

根据所述第一文本片段,从所述语料库中确定出N个候选声音片段,N≥1,且为整数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811269819.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top