[发明专利]鸟声音频的蝉鸣噪声消除方法、系统、装置及存储介质在审
申请号: | 202310521401.0 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116543785A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 张承云;金能挺;高星辉;朱洁琪 | 申请(专利权)人: | 广州大学 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232;G10L25/30 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鸟声 音频 噪声 消除 方法 系统 装置 存储 介质 | ||
本发明公开一种鸟声音频的蝉鸣噪声消除方法、系统、装置及存储介质,涉及计算机技术领域。其中,鸟声音频的蝉鸣噪声消除方法包括以下步骤:获取包含蝉鸣噪声的待处理鸟声音频;对所述待处理鸟声音频进行傅里叶变换得到第一幅度谱和第一相位谱;将所述第一幅度谱输入基于深度学习的鸟声降噪模型得到降噪后的第二幅度谱,其中,所述鸟声降噪模型包括依次连接的门控卷积编码器、序列建模模块和门控卷积解码器,所述序列建模模块包括分别用于对时间维度相关性和频率维度相关性建模的Conformer模块;将所述第一相位谱和所述第二幅度谱进行傅里叶逆变换得到降噪鸟声音频。本申请能够能够有效滤除鸟声音频中的蝉鸣噪声,提高鸟声音频降噪的降噪效果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种鸟声音频的蝉鸣噪声消除方法、系统、装置及存储介质。
背景技术
由于气候变化、栖息地丧失和环境污染等原因,鸟类多样性持续下降。近年来,被动声学监测技术在鸟类监测和保护方面得到了广泛的应用,因为这种方法可以减少人类活动对生态环境的破坏,同时降低监测成本。被动声学监测技术利用野外布设的录音设备产生的音频记录,通过深度学习和声学指数等技术对鸟类鸣声进行分析,以此来评估不同时空范围的鸟类物种丰富度等信息,进而评估生态环境状况。然而,大多数鸟类声学录音是在开放的野外环境中录制的,而野外现场声学环境非常复杂,通常包含各种噪声,如风雨声、交通声、昆虫声等。蝉鸣声是最常见的昆虫声之一,在所分析的环境记录中很常见。蝉从清晨到傍晚均会发声,鸣声持续时间长;其次,相对于录音中的其他声音,蝉鸣噪声的声压级大。这些蝉鸣噪声被录音设备记录后,会掩盖感兴趣的鸟类鸣叫声,影响鸟鸣声分析与信息提取。
目前,鸟声去噪通常采用传统的去噪方法去除平稳噪声,谱减法和基于短时谱幅度估计的最小均方误差法是常用的去噪方法,这些方法适用于平稳噪声的消除。对于高度不平稳噪声,如蝉鸣声噪声,抑制性能很差,会导致明显的残留噪声,特别是鸟声和蝉鸣声噪声在时域和频域重叠的情况下鸟声降噪效果差。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出鸟声音频的蝉鸣噪声消除方法、系统、装置及存储介质,能够有效滤除鸟声音频中的蝉鸣噪声,提高鸟声音频降噪的降噪效果。
一方面,本发明实施例提供了一种鸟声音频的蝉鸣噪声消除方法,包括以下步骤:
获取包含蝉鸣噪声的待处理鸟声音频;
对所述待处理鸟声音频进行傅里叶变换得到第一幅度谱和第一相位谱;
将所述第一幅度谱输入基于深度学习的鸟声降噪模型得到降噪后的第二幅度谱,其中,所述鸟声降噪模型包括依次连接的门控卷积编码器、序列建模模块和门控卷积解码器,所述序列建模模块包括分别用于对时间维度相关性和频率维度相关性建模的Conformer模块;
将所述第一相位谱和所述第二幅度谱进行傅里叶逆变换得到降噪鸟声音频。
根据本发明一些实施例,所述鸟声降噪模型通过以下步骤获得:
获取训练数据集,并通过傅里叶变换提取所述训练数据集中音频的幅度谱;
初始化鸟声降噪模型并设置优化参数,所述优化参数包括学习率、批次大小和训练次数;
根据所述批次大小和所述训练次数将所述训练数据集的幅度谱输入所述鸟声降噪模型得到降噪幅度谱;
根据损失函数计算所述降噪幅度谱和训练数据集中的训练标签之间的损失值;
根据所述学习率和所述损失值更新所述鸟声降噪模型。
根据本发明一些实施例,所述训练数据集通过以下步骤获得:
采集不同区域的多种鸟声数据和多种蝉鸣声数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310521401.0/2.html,转载请声明来源钻瓜专利网。