[发明专利]一种个性化歌唱语音的合成方法有效
申请号: | 200810107114.0 | 申请日: | 2008-07-17 |
公开(公告)号: | CN101308652A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | 王玉平;江源;凌震华;胡国平;胡郁;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04 |
代理公司: | 合肥天明专利事务所 | 代理人: | 袁由茂 |
地址: | 230088安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 歌唱 语音 合成 方法 | ||
技术领域
本发明涉及一种语音合成方法,具体涉及一种在只有少量朗读风格训练数据的情况下,合成出目标发音人歌唱风格语音的合成方法。
背景技术
近年来,语音合成技术获得了很大的发展,由于现在合成语音的音质和自然度都不错,大家对合成系统提出了更多的需求,比如多样化的语音合成,包括多个发音人、多种发音风格、多语种等,所以在可训练语音合成技术基础上发展起来的模型自适应技术得到了越来越广泛的应用,模型自适应技术在合成朗读风格语音的时候可以取得很好的效果,但是在针对歌唱风格的语音合成时缺乏足够的应用研究。
此外,为了合成出具有歌唱风格的合成语音,有关研究机构也进行了相关研究,主要方法是借鉴朗读风格的语音合成方法,首先录制一个规模较大的歌唱风格库,然后根据可训练语音合成方法来合成出歌唱风格的语音,这种方法可以合成比较自然真实的合成语音,但是由于歌唱时的控制很难,所以歌唱风格库的录制难度要远高于朗读风格库的录制,而且,如果要合成另外一个发音人的歌唱语音时,需要对这个发音人再录制一个歌唱风格库,对于大多数普通人来说,录制这样一个规模的歌唱风格库基本上是不可能的。
发明内容
本发明针对现有技术的不足,提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。
本发明是通过以下技术方案实现的:
一种个性化歌唱语音的合成方法,包括以下步骤实现:
(1)在大规模标准语音数据库上,用隐马尔科夫模型对语音的线谱频率系数进行建模,并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型;
(2)录制特定用户的少量朗读风格语音,并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应,得到该用户的个性化的线谱频率系数模型;
(3)对文本化的简谱中的歌词,经过文本处理分析后,得到上下文相关的属性集,然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;
(4)根据简谱对于唱歌的音调、节拍的约定,生成基频信息,并对(3)中预测得到的时长信息进行调整;
(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后,就生成了最后的参数,这些参数是既具有目标说话人特征,又具有歌唱特征的基频、时长和线谱频率参数。将这些参数输入参数化语音合成声码器,即可合成出个性化的歌唱语音。
一种个性化歌唱语音的合成方法,所述的个性化的线谱频率系数模型,通过标准线谱频率系数模型自适应训练得到,而标准线谱频率系数通过在一个或多个大规模的标准语音库上训练得到。
一种个性化歌唱语音的合成方法,所述的用于线谱频率系数模型自适应的语音录音所对应的文本是经过音素覆盖率搜索设计的文本。
一种个性化歌唱语音的合成方法,所述的步骤(2)中自适应方法是基于最大似然的线性回归的模型自适应方法。
一种个性化歌唱语音的合成方法,所述的基于最大似然的线性回归的模型自适应方法是根据最大似然准则估计一系列的线性变换,让这些变换抓住当前模型与目标模型之间的差异,对模型中所有的分布作调整。
一种个性化歌唱语音的合成方法,所述的步骤(4)中对所述基频参数的预测为由曲谱信息直接赋值。
一种个性化歌唱语音的合成方法,所述的步骤(4)中所述时长信息的调整是按照曲谱给定的信息来进行时长调整。
一种个性化歌唱语音的合成方法,所述的时长信息的调整是采用按比例分配来对时长进行调整。
本发明在可训练语音合成系统的基础上,将模型自适应和歌唱语音合成相结合,在Trainable TTS中将模型自适应方法和歌唱语音合成方法有机结合起来,使得在只有少量训练数据的前提下,合成的语音既具有目标说话人的特征,又具有歌唱风格,这样就不需要录制大量的各种发音人风格的歌曲风格库,使具有发音人个性化风格歌唱语音的合成成为现实,并极大的提高了合成系统的可扩展性和娱乐性。
附图说明
图1为个性化歌唱语音的合成方法的流程图。
图2为本发明模型自适应方法流程图。
具体实施方式
参见附图1、2所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810107114.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:波纹铜包铝母排及其制作
- 下一篇:轻型保温复合板及其工艺方法