[发明专利]构建个性化歌唱风格频谱合成模型的方法及装置有效
申请号: | 201410005753.1 | 申请日: | 2014-01-06 |
公开(公告)号: | CN104766603B | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 孙见青;王影;江源;凌震华;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种构建个性化歌唱风格频谱合成模型的方法及装置,该方法包括:训练源发音人朗读风格频谱合成模型和歌唱风格频谱合成模型;获取目标发音人朗读风格数据;根据所述源发音人朗读风格频谱合成模型及所述目标发音人朗读风格数据,确定源发音人与目标发音人的音色转换关系;根据所述音色转换关系对所述源发音人歌唱风格频谱合成模型进行模型转换,得到目标发音人歌唱风格频谱合成模型。本发明通过目标发音人少量朗读风格数据即可得到其歌唱风格合成模型,大大降低了一般用户构建歌唱合成模型的难度,进而有效地提高了个性化歌唱合成效果。 | ||
搜索关键词: | 频谱合成 风格 朗读 目标发音 发音 风格数据 个性化 合成模型 音色转换 构建 合成效果 获取目标 模型转换 用户构建 有效地 | ||
【主权项】:
1.一种构建个性化歌唱风格频谱合成模型的方法,其特征在于,包括:训练源发音人朗读风格频谱合成模型和歌唱风格频谱合成模型,其中所述频谱合成模型包括频谱参数模型及对应的决策树;获取目标发音人朗读风格数据;根据所述源发音人朗读风格频谱合成模型及所述目标发音人朗读风格数据,确定源发音人与目标发音人的音色转换关系;根据所述音色转换关系对所述源发音人歌唱风格频谱合成模型进行模型转换,得到目标发音人歌唱风格频谱合成模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410005753.1/,转载请声明来源钻瓜专利网。
- 上一篇:电子控制单元和具有电子控制单元的电动助力转向装置
- 下一篇:磁记录介质