[发明专利]一种基于Min-Max单分类深度神经网络的城市噪声识别方法在审
申请号: | 202111118137.3 | 申请日: | 2021-09-22 |
公开(公告)号: | CN113851119A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 曹九稳;夏军;王天磊;杨洁 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G06N3/04;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 min max 分类 深度 神经网络 城市 噪声 识别 方法 | ||
本发明公开了一种基于Min‑Max单分类深度神经网络的城市噪声识别方法。本发明包括如下步骤:步骤1、采集城市噪声信号,对采集的噪声信号进行预处理;步骤2、构建深度卷积神经网络;步骤3、构建单分类Min‑Max损失函数,训练神经网络权重、单分类超球面球心、以及决策阈值;步骤4、计算单分类器阈值;步骤5、对未知信号进行分类预测。本发明通过对每一种新出现的城市噪声建立单分类深度神经网络模型,获取包围同一类声音数据的超球面,来解决无法穷举各种声音类型的问题;通过构建深度神经网络提升模型对城市噪声信号的表示能力,提升监测性能;构建Min‑Max单分类损失函数,通过对超球面半径隐式地约束提升模型性能。
技术领域
本发明属于声音信号识别和深度神经网络领域,涉及一种基于Min-Max单分类深度神经网络的城市噪声识别方法。
背景技术
随着我国城镇化进程的加快和城市的飞速发展,噪声污染问题日益严重,很大程度上影响了城市的环境和人们的健康,城市噪声问题是当前城市发展面临的环境问题之一。采用人工智能方法,构建全天候智能监测系统,是目前该领域的一个主流方式。目前常见的城市噪声识别方法多是基于传统的语音特征提取算法结合多分类器的方式。然而这些方法存在着以下问题:
1)传统的声学特征提取方法无法充分表示复杂的城市噪声;而使用的多分类器受限于其弱表示能力,泛化能力有限。
2)目前的大部分研究是基于人工定义好的各种噪声类别。然而各种信号类型无法穷举且具有随机不确定性,这些方法并不适用,且使监测系统面临建模难的问题。
3)传统的噪声识别方法是基于一段短时范围内的声信号提取特征,而短时范围内的声信号存在非平稳性,其包含的时空信息有限。
因此,目前针对城市噪声的识别监测方法仍有很多改进的空间。
发明内容
本发明提出了一种基于Min-Max单分类深度神经网络的城市噪声识别方法来克服上述城市噪声识别中存在的问题。单分类算法更加贴合城市噪声监测。由于城市噪声种类多种多样且每种类型的声特性存在着差异,采集所有类型噪声信号数据显然是不切实际。因此该方法分别采用以下方式进行改进,包括1)通过对每一种新出现的城市噪声建立单分类深度神经网络模型,获取包围同一类声音数据的超球面,来解决无法穷举各种声音类型的问题;2)构建深度神经网络,提升模型对城市噪声信号的表示能力,提升监测性能;3)构建Min-Max单分类损失函数,通过对超球面半径隐式地约束,提升模型性能。
本发明的技术方案主要包括如下步骤:
步骤1、采集城市噪声信号,对采集的噪声信号进行预处理,包括去噪、分帧、加窗(其中帧长和帧移分别设为L和),最后转换为时频图;得到训练数据集XN×k=[X1,…,XN],其中N为所有训练样本的数量,k指代每个样本的维度。
步骤2、构建深度卷积神经网络,网络构成方法可以采用以下方式:1)以卷积、池化、激活构成卷积块,搭建深度卷积神经网络,并采用卷积自编码器进行网络权重初始化;2)采用在ImageNet上预训练的现有深度卷积神经网络结构。
2-1、对于方式1):深度卷积神经网络由若干卷积块组成,每个卷积块结构一致,包含卷积层、池化层、数据归一化层,卷积块的最后与全连接层相连,网络中激活函数均采用ReLu函数。特征X经过卷积层的输出为:
y=W*X+B (1)
其中,W为卷积的权重矩阵,B为其对应的偏置,*代表卷积操作。
卷积层的输出进入数据归一化函数的定义:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111118137.3/2.html,转载请声明来源钻瓜专利网。