[发明专利]音频处理的方法和装置有效
申请号: | 201811066716.6 | 申请日: | 2018-09-13 |
公开(公告)号: | CN109192218B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L25/03;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 | ||
1.一种音频处理的方法,其特征在于,所述方法包括:
对源音频进行变调处理得到目标音频,所述源音频是用户的人声音频;
显示本地音频列表;
当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频;
在所述目标音频中获取音色参考音频帧,提取所述音色参考音频帧的频谱包络特征信息;
提取所述源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息,提取所述源音频帧的辅音信息,所述基频信息是源音频帧频谱的峰值频率;
基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。
2.根据权利要求1所述的方法,其特征在于,所述对所述源音频进行变调处理得到所述目标音频,包括:
在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;
对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。
3.一种音频处理的装置,其特征在于,所述装置包括:
变调模块,用于对源音频进行变调处理得到目标音频,所述源音频是用户的人声音频;
显示模块,用于显示本地音频列表;
获取模块,用于当接收到对所述本地音频列表中的所述目标音频的选项的选取指令时,获取所述目标音频;
所述获取模块,还用于在所述目标音频中获取音色参考音频帧;
提取模块,用于提取所述音色参考音频帧的频谱包络特征信息,提取所述源音频中与所述音色参考音频帧的播放时间点相同的源音频帧的基频信息,提取所述源音频帧的辅音信息,所述基频信息是源音频帧频谱的峰值频率;
生成模块,用于基于所述基频信息、所述频谱包络特征信息和所述辅音信息,生成所述源音频帧对应的变音色音频帧。
4.根据权利要求3所述的装置,其特征在于,所述变调模块,用于:
在所述源音频中,每间隔第一预设数目的源音频帧,选取第二预设数目的源音频帧,复制所述第二预设数目的源音频帧,将复制的源音频帧,插入到选取的源音频帧之后,得到所述源音频对应的降速音频;
对所述降速音频进行重采样,得到与所述源音频的帧数目相同且时长相同的所述目标音频。
5.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1或2任一所述的音频处理的方法。
6.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1或2任一所述的音频处理的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811066716.6/1.html,转载请声明来源钻瓜专利网。