[发明专利]一种歌声合成方法、装置、计算机设备及存储介质在审
申请号: | 202010122318.2 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111402858A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 朱清影;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/08;G10H1/00 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 歌声 合成 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种歌声合成方法、装置、计算机设备及存储介质,其中,方法部分包括:获取语音数据;对语音数据进行解析,得到频谱包络、非周期指数、基频轮廓和音素;对乐谱中的音乐小节信息和基频轮廓进行合成处理;对基频轮廓进行基频控制处理;对第一基频轮廓和第二基频轮廓进行合成处理;对频谱包络和非周期指数进行频谱控制处理;对音素进行变速处理;将目标频谱包络、目标非周期指数、目标音素和目标基频轮廓进行合成处理,得到目标语音数据;对目标语音数据进行频谱控制处理,得到目标歌声数据。使得后续合成的目标歌声数据更符合用户发出的声音,以使歌声合成效果更好。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种歌声合成方法、装置、计算机设备及存储介质。
背景技术
随着信息技术的不断创新和完善,许多人机交互方面的音乐多媒体应用也逐渐走入我们的日常生活,目前,传统的歌声合成技术是基于共振模型和共振峰的合成法,传统的歌声合成技术主要在两个方向,一种是text-to-singing、lyrics-to-singing方向,也就是将纸面上的文字(歌词)转变为自然歌声的模拟,但上述方式不是直接将声音转变为歌声,应用场景比较局限,另外一种讲平常的说话声音转变为歌声,但这种方式研究眼于唱歌独特的声学特征及其感知效果,因此歌声合成效果较差。
发明内容
本发明提供一种歌声合成方法、装置、计算机设备及存储介质,以解决歌声合成的效果较差的问题。
一种歌声合成方法,包括:
获取语音数据;
对语音数据进行解析,得到语音数据对应的频谱包络、非周期指数、基频轮廓和音素;
从预设的乐谱数据库中获取乐谱;
对乐谱中的音乐小节信息和基频轮廓进行合成处理,得到合成处理后的第一基频轮廓;
对基频轮廓进行基频控制处理,得到基频控制处理后的第二基频轮廓;
对第一基频轮廓和第二基频轮廓进行合成处理,得到目标基频轮廓;
对频谱包络和非周期指数进行频谱控制处理,得到目标频谱包络和目标非周期指数;
对音素进行变速处理,得到变速处理后的目标音素;
将目标频谱包络、目标非周期指数、目标音素和目标基频轮廓进行合成处理,得到合成后的目标语音数据;
对合成后的目标语音数据进行频谱控制处理,得到目标歌声数据。
一种歌声合成装置,包括:
第一获取模块,获取语音数据;
解析模块,对语音数据进行解析,得到语音数据对应的频谱包络、非周期指数、基频轮廓和音素;
第二获取模块,从预设的乐谱数据库中获取乐谱;
第一合成模块,对乐谱中的音乐小节信息和基频轮廓进行合成处理,得到合成处理后的第一基频轮廓;
基频控制处理模块,对基频轮廓进行基频控制处理,得到基频控制处理后的第二基频轮廓;
第二合成模块,对第一基频轮廓和第二基频轮廓进行合成处理,得到目标基频轮廓;
第一频谱控制处理模块,对频谱包络和非周期指数进行频谱控制处理,得到目标频谱包络和目标非周期指数;
变速处理模块,对音素进行变速处理,得到变速处理后的目标音素;
第二合成模块,将目标频谱包络、目标非周期指数、目标音素和目标基频轮廓进行合成处理,得到合成后的目标语音数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122318.2/2.html,转载请声明来源钻瓜专利网。