[发明专利]一种个性化歌唱语音的合成方法有效
申请号: | 200810107114.0 | 申请日: | 2008-07-17 |
公开(公告)号: | CN101308652A | 公开(公告)日: | 2008-11-19 |
发明(设计)人: | 王玉平;江源;凌震华;胡国平;胡郁;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04 |
代理公司: | 合肥天明专利事务所 | 代理人: | 袁由茂 |
地址: | 230088安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种个性化歌唱语音的合成方法,包括以下步骤:对语音的线谱频率系数进行建模,并训练得到相关的决策树模型;录制特定用户的朗读风格语音,得到该用户的线谱频率系数模型;得到简谱中的歌词上下文相关的属性集,根据决策树模型和个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;根据简谱约定生成基频信息,并与生成的时长、频谱参数合并后,得到所有的合成参数,将这些参数输入参数化语音合成声码器,可合成出个性化的歌唱语音。本发明提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。 | ||
搜索关键词: | 一种 个性化 歌唱 语音 合成 方法 | ||
【主权项】:
1、一种个性化歌唱语音的合成方法,其特征在于包括以下步骤实现:(1)在大规模标准语音数据库上,用隐马尔科夫模型对语音的线谱频率系数进行建模,并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型;(2)录制特定用户的少量朗读风格语音,并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应,得到该用户的个性化的线谱频率系数模型;(3)对文本化的简谱中的歌词,经过文本处理分析后,得到上下文相关的属性集,然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;(4)根据简谱对于唱歌的音调、节拍的约定,生成基频信息,并对(3)中预测得到的时长信息进行调整;(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后,就生成了最后的参数。这些参数是既具有目标说话人特征,又具有歌唱特征的基频、时长和线谱频率参数,将这些参数输入参数化语音合成声码器,即可合成出个性化的歌唱语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810107114.0/,转载请声明来源钻瓜专利网。
- 上一篇:波纹铜包铝母排及其制作
- 下一篇:轻型保温复合板及其工艺方法