[发明专利]一种歌声生成方法、装置、终端和存储介质有效

申请号：	201810622548.8	申请日：	2018-06-15
公开（公告）号：	CN108831437B	公开（公告）日：	2020-09-01
发明（设计）人：	李昊	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10H7/00
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种歌声生成方法装置终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种歌声生成方法、装置、终端和存储介质，其中，歌声生成方法包括：获取用户录入的与歌曲对应的语音信号；从预先建立的声学特征模板中获取歌曲对应的标准声学特征信息，根据标准声学特征信息对语音信号进行声学特征信息的更新；其中，声学特征模板中保存有至少一首歌曲的标准声学特征信息；将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。本发明实施例克服了现有的利用大量的数据进行声学模型训练来实现语音到歌声的转换，且最终形成的歌声中不包含用户自己的声音，导致用户参与度和体验度不高的问题，实现了无需进行声学模型训练，即可实现将用户的语音转换为保留有用户自己的声音的歌声的效果。

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种歌声生成方法、装置、终端和存储介质。

背景技术

语音转换歌声是指将用户的语音转化成为对应的歌声。该类互联网产品能够在将用户的语音转化成为歌声后，结合伴奏音乐，合成用户自己的歌唱作品，具有娱乐性、社交性以及一定的市场价值。

现有技术中将语音转换为歌声的方案主要为：在模型训练阶段，使用专业歌手A的多个歌曲的文本数据(包括歌词等)以及歌手A演唱对应歌曲的声学特征，进行模型训练，得到歌手A的声学模型；在歌声生成阶段，获取用户B唱出或读出歌曲的语音数据，根据该语音数据识别歌曲的歌词并得到用户B的声学特征；将识别出的歌词输入歌手A的声学模型，得到该声学模型输出的预测声学特征，根据用户B的声学特征中的基频和音长更新预测声学特征中的基频和音长，得到修改后的声学特征，该修改后的声学特征包含的是用户B的基频、用户B的音长、歌手A的频谱，因此再对修改后的声学特征使用参数统计方法或者音库拼接方法，得到的歌声具有歌手A的声音特点和用户B的音高和节奏，达到了歌手A模仿用户B演唱歌曲的效果。

上述方案往往需要进行声学模型训练，其对样本数据量的要求较高，实现过程复杂，且会带来音质上的损失；此外，利用上述方法合成的歌声具有歌手的声音特点，导致用户的参与度和体验度不佳。

发明内容

本发明实施例提供一种歌声生成方法、装置、终端和存储介质，以达到无需进行声学模型训练，即可将用户的语音转化为保留有用户自己的声音的歌声的效果。

第一方面，本发明实施例提供了一种歌声生成方法，所述方法包括：

获取用户录入的与歌曲对应的语音信号；

从预先建立的声学特征模板中获取所述歌曲对应的标准声学特征信息，根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新；其中，所述声学特征模板中保存有至少一首歌曲的标准声学特征信息；

将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。

第二方面，本发明实施例还提供了一种歌声生成装置，所述装置包括：

语音信号获取模块，用于获取用户录入的与歌曲对应的语音信号；

声学特征信息更新模块，用于从预先建立的声学特征模板中获取所述歌曲对应的标准声学特征信息，根据所述标准声学特征信息对所述语音信号进行声学特征信息的更新；其中，所述声学特征模板中保存有至少一首歌曲的标准声学特征信息；

目标语音信号确定模块，用于将具有更新后的声学特征信息的语音信号作为目标语音信号进行存储或输出。

第三方面，本发明实施例还提供了一种歌声生成终端，所述终端包括：