[发明专利]音频处理方法、装置及存储介质有效
申请号: | 201810950948.1 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109065068B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 肖纯智 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L21/003 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 存储 介质 | ||
本发明公开了一种音频处理方法、装置及存储介质,属于语音技术领域。所述方法包括:获取待处理的第一音频;提取第一音频的基频信息、频谱包络信息和第一激励信号;根据该基频信息,确定目标周期信号,目标周期信号的峰值位于所述基频信息指示的基频的倍频处;将目标周期信号和第一激励信号进行叠加处理,得到第二激励信号;将第二激励信号和该频谱包络信息进行合成处理,得到第二音频。本发明可以在提升第一音频中的人声清晰度的同时,避免对第一音频中杂音的放大,提高了处理后的音频质量。
技术领域
本发明涉及语音技术领域,特别涉及一种音频处理方法、装置及存储介质。
背景技术
实际应用中,受到音源的录制场景或设备的限制,音频中一般不仅包括人声,还可能包括气息声、环境噪声或设备噪声等一定程度的杂音,导致音频中的人声不清晰。而为了提高音频中人声的清晰度,需要对音频进行处理。
相关技术中,提供了一种音频处理方法,包括:获取待处理的第一音频,然后对第一音频进行傅里叶变换,得到第一音频在频域上的第一频谱信号,再根据该第一频谱信号,使用均衡器增大频谱中的中高频信号的能量,得到第二频谱信号,最后,对第二频谱信号进行逆傅里叶变换,得到第二音频。由于人声的频率一般处于中高频区间,因此,通过增大中高频信号的能量,即可增大人声的亮度,使人声在音频中更加清晰。
但是,增大中高频信号的能量的方法,不仅会放大人声,还可能会放大处于中高频的气息声、环境噪声或设备噪声等杂音,导致处理后的音频中的杂音较大,音频质量较差。
发明内容
本发明实施例提供了一种音频处理方法、装置及存储介质,可以用于解决相关技术中存在的处理后的音频中杂音较大的问题。所述技术方案如下:
一方面,提供了一种音频处理方法,所述方法包括:
获取待处理的第一音频;
提取所述第一音频的基频信息、频谱包络信息和第一激励信号;
根据所述基频信息,确定目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
将所述目标周期信号和所述第一激励信号进行叠加处理,得到第二激励信号;
将所述第二激励信号和所述频谱包络信息进行合成处理,得到第二音频。
可选地,所述提取所述第一音频的基频信息、频谱包络信息和第一激励信号,包括:
对所述第一音频进行分帧处理,得到多个音频帧;
对于所述多个音频帧中的每个音频帧,提取所述每个音频帧的基频信息、频谱包络信息和第一激励信号。
可选地,所述提取所述每个音频帧的基频信息、频谱包络信息和第一激励信号,包括:
通过预设基频提取算法,提取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中,获取所述每个音频帧的频谱包络信息;
根据所述每个音频帧的频谱信号和频谱包络信息,确定所述每个音频帧的第一激励信号。
可选地,所述根据所述基频信息,确定目标周期信号,包括:
根据所述每个音频帧的基频信息,确定所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
所述将所述目标周期信号和所述第一激励信号进行叠加处理,得到第二激励信号,包括:
将所述每个音频帧的目标周期信号和第一激励信号进行叠加处理,得到所述每个音频帧的第二激励信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810950948.1/2.html,转载请声明来源钻瓜专利网。