[发明专利]一种合成语音自然度的提升方法在审
申请号: | 201410828928.9 | 申请日: | 2014-12-26 |
公开(公告)号: | CN104485099A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | 高丽;凌震华;陈凌辉 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合成 语音 自然 提升 方法 | ||
技术领域
本发明涉及音频处理技术领域,尤其涉及一种合成语音自然度的提升方法。
背景技术
近几年来,在从文本到语音(TTS)的合成领域,基于隐马尔科夫模型(HMM)的语音合成已经发展成为一种主流的合成方法。它能够合成拥有高可懂度的高质量语音,但是在自然度上,由于合成的基频曲线过于平滑,因此与自然录音相比依然比较单调乏味。造成这一现象的一个重要原因是由于采用高斯声学模型时所产生的平均效应,而且基频F0是一种超音段的声学特征,拥有丰富的长时性特征,例如音节音调、短语语调等。
现有技术致力于从改变基频建模的模型结构和参数生成准则的角度来提高合成语音的自然度;然而,传统的基于HMM的语音合成系统在基频建模时一直把音素作为最基本建模单元,把帧一级的基频作为模型观测值,这就导致传统模型对基频长时特征不具备很好的建模能力,也就使得合成语音听起来没有自然语言那样生动形象。
发明内容
本发明的目的是提供一种合成语音自然度的提升方法,可以提高合成语音的自然度,使之更为真实、生动。
本发明的目的是通过以下技术方案实现的:
(与权利要求相对应)。
由上述本发明提供的技术方案可以看出,采用基于GBAM的基频后滤波方法来提高合成语音的自然度,该方法用一个类高斯的联合分布来描述合成基频参数和自然基频参数之间的关系,联合分布的参数通过训练数据预测而得。在转换阶段,根据已获得的GBAM得到条件分布和传统方法所获得的基频特征,来完成从合成基频到自然基频的转换,从而可以提高合成语音的自然度,使之更为真实、生动。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种合成语音自然度的提升方法的流程图;
图2为本发明实施例提供的目标逼近模型的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
实施例
图1为本发明实施例提供的一种合成语音自然度的提升方法的流程图。如图1所示该方法主要包括如下步骤:
步骤1、构建一个基于隐马尔科夫模型HMM的语音合成系统,并基于该语音合成系统及自然录音获得合成语音。
步骤2、分别提取该合成语音及自然录音的基频特征,并进行高斯双向联想贮存器GBAM模型训练。
本发明实施例中,提取的基频特征包括:长度规整的对数F0向量(FV)和定量目标逼近模型(qTA)参数;
其中,提取FV包括:根据音节的边界对每句话进行音节切分,再检测每个音节的浊音段边界;然后,基于声学建模考虑,对每个音节内浊音段的基频取对数,并将其规整到M个点,获得FV,表示为F=[f1,f2,...,fM]T。
qTA参数的提取依据目标逼近(TA)模型和定量目标逼近(qTA)模型。传统的TA模型模拟基频产生的内在机制,假设基频运动的音高目标与音节同步,如图2所示。中间的竖线表示音节边界,虚线表示潜在的音高目标,实线表示基频轨迹;TA模型强调在每个音节的结尾处,基频轨迹都将不断逼近音高目标。TA模型假设有动态和静态两种类型的音高目标。
中文是一种很有代表性的声调语言,它包含四种声调:阴平、阳平、上声和去声。在TA模型中,阴平和上声对应于静态目标,阳平和去声对应于动态目标。
qTA模型是TA模型的定量模型之一,它是一个三阶临界阻尼线性系统,可以用下述公式表示:
f(t)=T(t)+(c0+c1t+c2t2)e-λt;
其中,t表示相对于音节起始位置的相对时间,f(t)是完整的基频表达形式,T(t)表示潜在的音高目标,可用下式表示:
T(t)=st+h;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410828928.9/2.html,转载请声明来源钻瓜专利网。