[发明专利]一种演唱声音转换器在审
申请号: | 201910868874.1 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110782866A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 杨宇娟;王小侠;曹鑫 | 申请(专利权)人: | 中北大学 |
主分类号: | G10H1/36 | 分类号: | G10H1/36;G10H7/00;G10L25/30 |
代理公司: | 11640 北京中索知识产权代理有限公司 | 代理人: | 周国勇 |
地址: | 030051*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音色库 合成 声音特征 音频识别 合成器 播放器 声音转换器 神经网络模型 调用目标 实时检测 音乐器械 歌曲 预设 音色 发送 转换 保证 | ||
1.一种演唱声音转换器,其特征在于,所述演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;
所述用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统;
所述音频识别系统,用于通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,并将所述声音特征发送给所述即时合成器;
所述即时合成器,用于从所述人声音色库中确定出目标人声音色库,并根据所述声音特征,调用所述目标人声音色库中的音色,合成新演唱声音,并将所述新演唱声音发送给所述播放器;
所述播放器,用于实时播放所述新演唱声音。
2.根据权利要求1所述的演唱声音转换器,其特征在于,所述实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统,包括:
每当检测到转换用户演唱歌曲的一个音频时,将所述一个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统;或者,
当检测到转换用户演唱歌曲的预设数值个音频时,将所述预设数值个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统。
3.根据权利要求1所述的演唱声音转换器,其特征在于,所述通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,包括:
将所述演唱声音输入所述预设神经网络模型,并将所述预设神经网络模型的输出确定为所述演唱声音的声音特征。
4.根据权利要求1所述的演唱声音转换器,其特征在于,所述通过预设神经网络模型识别所述演唱声音之前,还包括:
获取演唱声音集,通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型。
5.根据权利要求4所述的演唱声音转换器,其特征在于,所述通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型,包括:
标注所述演唱声音集中的各个演唱声音的声音特征;
将所述演唱声音集中的各个演唱声音输入神经网络,根据所述神经网络的输出与标注的声音特征之间的差值,调整所述神经网络的参数;
当所述演唱声音集中的各个演唱声音输入所述神经网络后,所述神经网络的输出均与标注的声音特征之间的差值小于预设参数阈值时,将所述神经网络确定为所述预设神经网络模型。
6.根据权利要求1所述的演唱声音转换器,其特征在于,所述声音特征包括音高和拼音,所述从人声音色库中确定出目标人声音色库之前,还包括:
用户预先录制汉语的所有拼音组合的第一预设声调对应的音色;
识别所述音色的音高是否为第一预设音高,如果所述音色的音高不是第一预设音高,则通过变速变调算法,将所述音色的音高调整为第一预设音高;
根据所述音色的音高和拼音的声调,通过预设算法扩展出第二预设音高和第二预设声调的音色,并标记每个音色的音高和拼音,生成一个所述人声音色库。
7.根据权利要求1所述的演唱声音转换器,其特征在于,所述根据所述声音特征,调用目标人声音色库中的音色,合成新演唱声音,包括:
在所述目标人声音色库中查找所述声音特征;
当查找到所述声音特征时,调用所述声音特征对应的音色,合成新演唱声音。
8.根据权利要求7所述的演唱声音转换器,其特征在于,所述在所述目标人声音色库中查找所述声音特征之后,还包括:
当无法查找到所述声音特征时,调用与所述声音特征相似度大于预设相似度阈值的音色,合成新演唱声音。
9.根据权利要求7所述的演唱声音转换器,其特征在于,所述在所述目标人声音色库中查找所述声音特征之后,还包括:
当无法查找到所述声音特征时,返回合成失败信号,并提示用户更新所述目标人声音色库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中北大学,未经中北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910868874.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维声音创作交互式系统
- 下一篇:一种控制器I/O口蜂鸣器驱动电路