[发明专利]歌曲多媒体的合成方法、装置、电子设备及存储介质在审
申请号: | 202011164612.6 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112331234A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 吴思远;李超;孙晨曦 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌曲 多媒体 合成 方法 装置 电子设备 存储 介质 | ||
本申请公开了歌曲多媒体的合成方法、装置、电子设备及存储介质,涉及语音技术、深度学习技术领域。具体实现方案为:响应于歌曲多媒体合成请求,显示素材获取模式;获取用户通过所选择的素材获取模式提供的用户音频;将用户音频输入音色提取模型,以得到音色提取模型输出的用户音色;获取用户通过所选择的素材获取模式提供的待合成的歌词以及待合成的曲谱,并将用户音色、待合成的歌词以及待合成的曲谱输入歌曲合成模型,以得到合成后的歌曲多媒体,从而扩展了用户提供各种素材的方式,方便用户根据自身条件提供各种素材,减少了用户生成带自己音色的歌曲多媒体所需要进行的操作等,降低了歌曲多媒体的合成成本,提高了歌曲多媒体的合成效率。
技术领域
本申请涉及计算机技术领域,具体涉及语音技术、深度学习技术领域,尤其涉及歌曲多媒体的合成方法、装置、电子设备及存储介质。
背景技术
相关技术中,音乐合成方法主要为,获取用户所提供的说话素材,结合曲谱对用户所提供的说话素材进行剪辑以及声调处理等,生成该用户的唱歌效果。
然而,上述方法中,需要人员花费大量的时间去进行手动剪辑以及手动声调处理操作,例如一周到半个月,剪辑时间长,成本高,且剪辑得到的唱歌效果较差。
发明内容
本公开提供了一种歌曲多媒体的合成方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种歌曲多媒体的合成方法,包括:响应于歌曲多媒体合成请求,显示素材获取模式;获取用户通过所选择的素材获取模式提供的用户音频;将所述用户音频输入音色提取模型,以得到所述音色提取模型输出的用户音色;获取用户通过所选择的素材获取模式提供的待合成的歌词以及待合成的曲谱,并将所述用户音色、所述待合成的歌词以及所述待合成的曲谱输入歌曲合成模型,以得到合成后的歌曲多媒体。
根据本公开的另一方面,提供了一种歌曲多媒体的合成装置,包括:显示模块,用于响应于歌曲多媒体合成请求,显示素材获取模式;第一获取模块,用于获取用户通过所选择的素材获取模式提供的用户音频;音色提取模块,用于将所述用户音频输入音色提取模型,以得到所述音色提取模型输出的用户音色;合成模块,用于获取用户通过所选择的素材获取模式提供的待合成的歌词以及待合成的曲谱,并将所述用户音色、所述待合成的歌词以及所述待合成的曲谱输入歌曲合成模型,以得到合成后的歌曲多媒体。
根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的歌曲多媒体的合成方法。
根据第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的歌曲多媒体的合成方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请第三实施例的示意图;
图4是根据本申请第四实施例的示意图;
图5是用来实现本申请实施例的歌曲多媒体的合成方法的电子设备的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011164612.6/2.html,转载请声明来源钻瓜专利网。