[发明专利]音频处理方法、装置及存储介质有效

申请号：	201810950948.1	申请日：	2018-08-17
公开（公告）号：	CN109065068B	公开（公告）日：	2021-03-30
发明（设计）人：	肖纯智	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L21/003
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	郭晶
地址：	510660 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频处理方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种音频处理方法、装置及存储介质，属于语音技术领域。所述方法包括：获取待处理的第一音频；提取第一音频的基频信息、频谱包络信息和第一激励信号；根据该基频信息，确定目标周期信号，目标周期信号的峰值位于所述基频信息指示的基频的倍频处；将目标周期信号和第一激励信号进行叠加处理，得到第二激励信号；将第二激励信号和该频谱包络信息进行合成处理，得到第二音频。本发明可以在提升第一音频中的人声清晰度的同时，避免对第一音频中杂音的放大，提高了处理后的音频质量。

技术领域

本发明涉及语音技术领域，特别涉及一种音频处理方法、装置及存储介质。

背景技术

实际应用中，受到音源的录制场景或设备的限制，音频中一般不仅包括人声，还可能包括气息声、环境噪声或设备噪声等一定程度的杂音，导致音频中的人声不清晰。而为了提高音频中人声的清晰度，需要对音频进行处理。

相关技术中，提供了一种音频处理方法，包括：获取待处理的第一音频，然后对第一音频进行傅里叶变换，得到第一音频在频域上的第一频谱信号，再根据该第一频谱信号，使用均衡器增大频谱中的中高频信号的能量，得到第二频谱信号，最后，对第二频谱信号进行逆傅里叶变换，得到第二音频。由于人声的频率一般处于中高频区间，因此，通过增大中高频信号的能量，即可增大人声的亮度，使人声在音频中更加清晰。

但是，增大中高频信号的能量的方法，不仅会放大人声，还可能会放大处于中高频的气息声、环境噪声或设备噪声等杂音，导致处理后的音频中的杂音较大，音频质量较差。

发明内容

本发明实施例提供了一种音频处理方法、装置及存储介质，可以用于解决相关技术中存在的处理后的音频中杂音较大的问题。所述技术方案如下：

一方面，提供了一种音频处理方法，所述方法包括：

获取待处理的第一音频；

提取所述第一音频的基频信息、频谱包络信息和第一激励信号；

根据所述基频信息，确定目标周期信号，所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处；

将所述目标周期信号和所述第一激励信号进行叠加处理，得到第二激励信号；

将所述第二激励信号和所述频谱包络信息进行合成处理，得到第二音频。

可选地，所述提取所述第一音频的基频信息、频谱包络信息和第一激励信号，包括：

对所述第一音频进行分帧处理，得到多个音频帧；

对于所述多个音频帧中的每个音频帧，提取所述每个音频帧的基频信息、频谱包络信息和第一激励信号。