[发明专利]音频处理的方法和装置有效
申请号: | 201811066716.6 | 申请日: | 2018-09-13 |
公开(公告)号: | CN109192218B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L25/03;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 | ||
本发明公开了一种音频处理的方法和装置,属于音频编辑技术领域。所述方法包括:在目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。采用本发明,可以有效解决变声过程中音调改变的技术问题。
技术领域
本发明涉及音频编辑技术领域,特别涉及一种音频处理的方法和装置。
背景技术
现在,很多手机上都有变声软件,对人声进行男女声或者童声大叔声的转换,对于用户来说是一件很有趣味的事情。
相关技术中变声的原理为:将源音频每隔几音频帧复制一音频帧,然后将复制的音频帧插入到被复制的音频帧后边,得到时长变长的降速音频。对降速音频进行重采样得到时长与源音频相同的新音频。新音频的音调和音色都发生了改变,从而达到了变声的目的。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
当想要将变调后的人声音频与伴奏音频合成歌曲音频时,有以下两种情况:如果伴奏音频相应的变调,由于伴奏音频的音调改变,伴奏音频的音质就会受损,最后合成的歌曲音频的质量就会下降;如果伴奏音频不变调,那么变调后的人声音频和不变调的伴奏音频不在一个音调上,合成的歌曲音频听觉效果差。
发明内容
为了解决相关技术中存在的问题,本发明实施例提供了一种音频处理的方法和装置。所述技术方案如下:
第一方面,提供了一种音频处理的方法,所述方法包括:
在目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;
提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;
基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧。
可选的,所述方法还包括:
提取所述源音频帧的辅音信息;
所述基于所述基频信息和所述频谱包络特征信息,生成所述源音频帧对应的变音色音频帧,包括:
基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。
可选的,所述在目标音频中获取音色参考音频帧之前,还包括:
对所述源音频进行变调处理得到所述目标音频。
可选的,所述对所述源音频进行变调处理得到所述目标音频,包括:
在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;
对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。
可选的,所述在目标音频中获取音色参考音频帧之前,还包括:
显示本地音频列表;
当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频。
第二方面,提供了一种音频处理的装置,所述装置包括:
获取模块,用于在目标音频中获取音色参考音频帧;
提取模块,用于提取所述音色参考音频帧的频谱包络特征信息和提取源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811066716.6/2.html,转载请声明来源钻瓜专利网。