[发明专利]一种演唱声音转换器在审
申请号: | 201910868874.1 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110782866A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 杨宇娟;王小侠;曹鑫 | 申请(专利权)人: | 中北大学 |
主分类号: | G10H1/36 | 分类号: | G10H1/36;G10H7/00;G10L25/30 |
代理公司: | 11640 北京中索知识产权代理有限公司 | 代理人: | 周国勇 |
地址: | 030051*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音色库 合成 声音特征 音频识别 合成器 播放器 声音转换器 神经网络模型 调用目标 实时检测 音乐器械 歌曲 预设 音色 发送 转换 保证 | ||
本发明公开了一种演唱声音转换器,属于音乐器械技术领域。演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将演唱声音发送给音频识别系统;音频识别系统,用于通过预设神经网络模型识别演唱声音,确定演唱声音的声音特征,并将声音特征发送给即时合成器;即时合成器,用于从人声音色库中确定出目标人声音色库,并根据声音特征,调用目标人声音色库中的音色,合成新演唱声音,并将新演唱声音发送给播放器。本发明可以在用户演唱歌曲的同时,即时合成新演唱声音,减少了合成前的计算时间,加快了合成新演唱声音的速度,保证了合成的及时性。
技术领域
本发明涉及音乐器械技术领域,特别涉及一种演唱声音转换器。
背景技术
在音乐演唱中,同一首歌有不同的唱法,不同的人对同一首歌也有不同的情感表达,有时需要将一个人演唱的声音转换为另一个人演唱的声音,而有时需要将一个人演唱的声音转换成不同的声音版本(如美声唱法、民族唱法等)。
现有技术中,变声器或变声软件往往是先采集并识别用户演唱声音的音频信号,然后再对识别到的音频信号进行处理,修改其音频特征,从而对识别到的音频信号进行转换,得到新的演唱声音。
然而,上述转换均是通过对音频信号的改变,实现对演唱声音的改变,依然会保留原始演唱声音的音频特征,不能对演唱声音进行很好的处理,演唱声音转换的准确率较低;另外,上述转换均是先识别用户演唱声音的音频信号,然后再进行演唱声音的转换,也即将音频识别和声音转换分开处理,无法进行即时转换,演唱声音转换的效率较低。
发明内容
为了解决相关技术中演唱声音转换的准确率较低和效率较低的问题,本发明实施例提供了一种演唱声音转换器,所述演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;
所述用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统;
所述音频识别系统,用于通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,并将所述声音特征发送给所述即时合成器;
所述即时合成器,用于从所述人声音色库中确定出目标人声音色库,并根据所述声音特征,调用所述目标人声音色库中的音色,合成新演唱声音,并将所述新演唱声音发送给所述播放器;
所述播放器,用于实时播放所述新演唱声音。
可选地,所述实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统,包括:
每当检测到转换用户演唱歌曲的一个音频时,将所述一个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统;或者,
当检测到转换用户演唱歌曲的预设数值个音频时,将所述预设数值个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统。
可选地,所述通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,包括:
将所述演唱声音输入所述预设神经网络模型,并将所述预设神经网络模型的输出确定为所述演唱声音的声音特征。
可选地,所述通过预设神经网络模型识别所述演唱声音之前,还包括:
获取演唱声音集,通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型。
可选地,所述通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型,包括:
标注所述演唱声音集中的各个演唱声音的声音特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中北大学,未经中北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910868874.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维声音创作交互式系统
- 下一篇:一种控制器I/O口蜂鸣器驱动电路