[发明专利]一种歌声生成方法、装置、终端和存储介质有效
申请号: | 201810622548.8 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108831437B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 李昊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10H7/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 歌声 生成 方法 装置 终端 存储 介质 | ||
本发明实施例公开了一种歌声生成方法、装置、终端和存储介质,其中,歌声生成方法包括:获取用户录入的与歌曲对应的语音信号;从预先建立的声学特征模板中获取歌曲对应的标准声学特征信息,根据标准声学特征信息对语音信号进行声学特征信息的更新;其中,声学特征模板中保存有至少一首歌曲的标准声学特征信息;将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。本发明实施例克服了现有的利用大量的数据进行声学模型训练来实现语音到歌声的转换,且最终形成的歌声中不包含用户自己的声音,导致用户参与度和体验度不高的问题,实现了无需进行声学模型训练,即可实现将用户的语音转换为保留有用户自己的声音的歌声的效果。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种歌声生成方法、装置、终端和存储介质。
背景技术
语音转换歌声是指将用户的语音转化成为对应的歌声。该类互联网产品能够在将用户的语音转化成为歌声后,结合伴奏音乐,合成用户自己的歌唱作品,具有娱乐性、社交性以及一定的市场价值。
现有技术中将语音转换为歌声的方案主要为:在模型训练阶段,使用专业歌手A的多个歌曲的文本数据(包括歌词等)以及歌手A演唱对应歌曲的声学特征,进行模型训练,得到歌手A的声学模型;在歌声生成阶段,获取用户B唱出或读出歌曲的语音数据,根据该语音数据识别歌曲的歌词并得到用户B的声学特征;将识别出的歌词输入歌手A的声学模型,得到该声学模型输出的预测声学特征,根据用户B的声学特征中的基频和音长更新预测声学特征中的基频和音长,得到修改后的声学特征,该修改后的声学特征包含的是用户B的基频、用户B的音长、歌手A的频谱,因此再对修改后的声学特征使用参数统计方法或者音库拼接方法,得到的歌声具有歌手A的声音特点和用户B的音高和节奏,达到了歌手A模仿用户B演唱歌曲的效果。
上述方案往往需要进行声学模型训练,其对样本数据量的要求较高,实现过程复杂,且会带来音质上的损失;此外,利用上述方法合成的歌声具有歌手的声音特点,导致用户的参与度和体验度不佳。
发明内容
本发明实施例提供一种歌声生成方法、装置、终端和存储介质,以达到无需进行声学模型训练,即可将用户的语音转化为保留有用户自己的声音的歌声的效果。
第一方面,本发明实施例提供了一种歌声生成方法,所述方法包括:
获取用户录入的与歌曲对应的语音信号;
从预先建立的声学特征模板中获取所述歌曲对应的标准声学特征信息,根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新;其中,所述声学特征模板中保存有至少一首歌曲的标准声学特征信息;
将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。
第二方面,本发明实施例还提供了一种歌声生成装置,所述装置包括:
语音信号获取模块,用于获取用户录入的与歌曲对应的语音信号;
声学特征信息更新模块,用于从预先建立的声学特征模板中获取所述歌曲对应的标准声学特征信息,根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新;其中,所述声学特征模板中保存有至少一首歌曲的标准声学特征信息;
目标语音信号确定模块,用于将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。
第三方面,本发明实施例还提供了一种歌声生成终端,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上第一方面所述的歌声生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810622548.8/2.html,转载请声明来源钻瓜专利网。