[发明专利]歌唱合成中基频参数生成方法及系统有效
申请号: | 201310336896.6 | 申请日: | 2013-08-05 |
公开(公告)号: | CN103456295A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 孙见青;凌震华;何婷婷;胡郁;胡国平 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 朱登河 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌唱 合成 基频 参数 生成 方法 系统 | ||
技术领域
本发明涉及语音合成处理技术领域,具体涉及一种歌唱合成中基频参数生成方法及系统。
背景技术
近年来,歌唱合成系统得到了广泛的研究和应用,其中有基于隐马尔科夫模型(Hidden Markov Model,HMM)的参数合成系统以及基于波形拼接合成的系统。相比于基于波形拼接合成的系统,参数合成方法对训练数据量要求较少且系统规模较小,因而具有较好的实用价值。基于参数合成的歌唱合成系统首先分别确定各基本合成单元(如音节,音素等)的时长参数序列,基频参数序列以及频谱参数序列,随后再根据各参数序列利用参数合成器得到连续歌唱信号。
作为语音信号最主要影响因素的基频参数,其准确性对歌唱合成效果有着至关重要的作用。目前传统系统主要采用如下两种方式生成:
(1)基于数据驱动的统计模型挑选方法:该方法预先录制歌唱语音训练数据并根据对应简谱标注信息(如歌词标注、音高标注及时长标注等)训练得到各基本合成单元的基于真实数据驱动的基频模型;在接收到歌唱合成请求时,根据简谱标注信息获取各基本合成单元对应的基频模型进而生成相应的基频参数。该方法通过对真实数据的统计模拟得到符合发音人音色特点的基频模型,然而由于建模本身带来的损失、以及基频模型选择的不完全准确性,该方法很难保证最终合成效果的稳定性。
(2)基于规则生成的方法:该方法根据简谱音高标注确定各基本合成单元对应的标准音高,并根据音高基频转换公式直接生成基频参数。这种方法实现简单高效,但由于简谱的标注音高并不一定满足发音人音域分布,从而导致根据标准音高获取的基频参数与发音人频谱参数间存在明显不符现象,影响合成语音的听感。
发明内容
本发明实施例提供一种歌唱合成中基频参数生成方法及系统,以使基频参数更符合发音人的音域范围,并保证最终合成效果的稳定性。
为此,本发明提供如下技术方案:
一种歌唱合成中基频参数生成方法,包括:
接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;
根据所述音高标注确定各基本合成单元的理论基频参数;
根据所述歌词标注确定各基本合成单元的基频参考模型;
根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。
优选地,所述根据所述歌词标注确定各基本合成单元的基频参考模型包括:
对所述歌词标注进行切分,获取各基本合成单元;
对所述各基本合成单元进行文本解析,获得所述基本合成单元的上下文信息,所述上下文信息包括:音素序列、声调、韵律词、韵律短语;
获取所述基本合成单元对应的基频二叉决策树;
根据所述上下文信息在所述基频二叉决策树中进行路径决策,得到对应的叶节点;
将所述叶节点对应的基频模型作为所述合成单元的基频参考模型。
优选地,所述方法还包括按以下方式构建各基本合成单元对应的基频二叉决策树:
采集训练数据并对所述训练数据进行信息标注;
从所述训练数据中提取各基本语音合成单元对应语音片断的基频参数;
根据所述基本合成单元对应语音片断的标注信息和基频参数,构建所述基本合成单元对应的基频二叉决策树;
对所述基频二叉决策树的各节点分别训练得到一个基频模型。
优选地,所述根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化包括:
对所述理论基频参数进行升降调处理,得到不同基调下的基频参数;
计算不同基调下的基频参数与所述基频参考模型的似然度;
选择具有最大似然度的基频参数作为优化的基频参数。
优选地,所述根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化包括:
根据简谱信息中的节奏信息计算各基本合成单元的理论时长;
根据所述理论时长获取简谱对应的理论基频参数序列;
获取所述简谱对应的基频参考模型序列;
根据所述基频参考模型序列对所述理论基频参数序列进行联合优化。
优选地,所述根据所述基频参考模型序列对所述理论基频参数序列进行联合优化包括:
分别对所述理论基频参数序列中所有理论基频参数统一升降调处理,得到不同基调下的基频参数序列;
计算所述不同基调下基频参数序列与所述基频参考模型序列的似然度;
选择具有最大似然度的基频参数序列作为优化的基频参数序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310336896.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种太阳能发电板的聚光结构
- 下一篇:用于测量磁场的设备和方法