[发明专利]一种音频去噪方法、装置、电子设备及存储介质在审
申请号: | 202110227732.4 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112908352A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 方兵晓;张帆;刘梁 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱琳爱义 |
地址: | 巴西班让路枫树*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 方法 装置 电子设备 存储 介质 | ||
1.一种音频去噪方法,其特征在于,包括:
对获取的待处理带噪音频进行分帧处理,获得音频帧;
从所述音频帧中依次获取一帧音频帧作为当前音频帧进行如下处理:
对所述当前音频帧进行特征提取,获得所述当前音频帧的包络谱特征;
根据所述当前音频帧的包络谱特征确定所述当前音频帧所属的音频场景类型,所述音频场景类型包括音乐场景或非音乐场景;
根据所述当前音频帧所属的音频场景类型对应的去噪策略对所述当前音频帧进行去噪处理。
2.如权利要求1所述的方法,其特征在于,根据所述当前音频帧的包络谱特征确定所述当前音频帧所属的音频场景类型,具体包括:
将所述当前音频帧的包络谱特征输入训练的音频场景识别模型,获得所述当前音频帧所属的音频场景类型为音乐场景的概率;
根据所述当前音频帧所属的音频场景类型为音乐场景的概率确定所述当前音频帧所属的音频场景类型。
3.如权利要求2所述的方法,其特征在于,当确定所述当前音频帧所属的音频场景类型为非音乐场景时,根据所述当前音频帧所属的音频场景类型对应的去噪策略对所述当前音频帧进行去噪处理,具体包括:
确定所述当前音频帧的初始噪声能量;
当确定所述当前音频帧的上一帧音频帧所属的音频场景类型为音乐场景时,根据存储的所述上一帧所属的音频场景类型为音乐场景的音频帧的噪声能量、所述当前音频帧的初始噪声能量和第一预设更新概率进行噪声能量更新,获得所述当前音频帧的噪声能量并存储;
根据所述当前音频帧的噪声能量对所述当前音频帧进行去噪处理。
4.如权利要求3所述的方法,其特征在于,当确定所述当前音频帧所属的音频场景类型为音乐场景时,根据所述当前音频帧所属的音频场景类型对应的去噪策略对所述当前音频帧进行去噪处理,具体包括:
确定所述当前音频帧的初始噪声能量;
根据所述第一预设更新概率和所述当前音频帧所属的音频场景类型为音乐场景的概率确定第二更新概率;
根据存储的上一帧音频帧的噪声能量、所述当前音频帧的初始噪声能量和所述第二更新概率进行噪声能量更新,获得所述当前音频帧的噪声能量并存储;
根据所述当前音频帧的噪声能量对所述当前音频帧进行去噪处理。
5.如权利要求4所述的方法,其特征在于,根据所述第一预设更新概率和所述当前音频帧所属的音频场景类型为音乐场景的概率确定第二更新概率,具体包括:
通过以下公式确定所述第二更新概率:
p2=(1-p0)×p1
其中,p2表示所述第二更新概率;
p0表示所述当前音频帧所属的音频场景类型为音乐场景的概率;
p1表示所述第一预设更新概率。
6.一种音频去噪装置,其特征在于,包括:
预处理单元,用于对获取的待处理带噪音频进行分帧处理,获得音频帧;
特征提取单元,用于从所述音频帧中依次获取一帧音频帧作为当前音频帧进行如下处理:对所述当前音频帧进行特征提取,获得所述当前音频帧的包络谱特征;
确定单元,用于根据所述当前音频帧的包络谱特征确定所述当前音频帧所属的音频场景类型,所述音频场景类型包括音乐场景或非音乐场景;
去噪单元,用于根据所述当前音频帧所属的音频场景类型对应的去噪策略对所述当前音频帧进行去噪处理。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5任一项所述的音频去噪方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~5任一项所述的音频去噪方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110227732.4/1.html,转载请声明来源钻瓜专利网。