[发明专利]基于数据增强和时频分离的CNN水声信号目标识别方法有效

专利信息
申请号: 202011063007.X 申请日: 2020-09-30
公开(公告)号: CN112257521B 公开(公告)日: 2023-04-07
发明(设计)人: 沈同圣;刘峰;赵德鑫;罗再磊;李光明 申请(专利权)人: 中国人民解放军军事科学院国防科技创新研究院
主分类号: G06F18/10 分类号: G06F18/10;G06F18/213;G06F18/214;G06F18/24;G06N3/0464
代理公司: 北京理工大学专利中心 11120 代理人: 高会允
地址: 100071 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 增强 分离 cnn 信号 目标 识别 方法
【权利要求书】:

1.基于数据增强和时频分离的CNN水声信号目标识别方法,其特征在于,包括如下步骤:

步骤1:获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号样本,据此构建训练集和测试集;

步骤2:对原始时域信号样本进行数据增强和扩充,针对原始时域信号样本,在添加高斯噪声的基础上,采用时域拉伸和音调变换的方式进行扩展,得到第一次扩展后的数据;

针对原始时域信号样本,提取Mel功率谱,再采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,得到第二次扩展后的数据;

步骤3:按照原始时域信号所属目标类别对第一次扩展后的数据和第二次扩展后的数据进行标注,将第一次扩展后的数据提取Mel功率谱后,与第二次扩展后的数据一起进行归一化处理,作为待识别水声信号的频谱特征;

步骤4:利用训练集中样本得到的待识别水声信号的频谱特征,采用如下方式进行目标分类模型训练:

根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,将低频特征和高频特征分别输入独立的卷积神经网络即CNN网络;对两个独立的CNN网络的输出特征进行串联,并利用两个全连接层实现目标分类;

步骤5:采用测试集中样本得到的待识别水声信号的频谱特征,输入至训练好的目标分类模型进行分类识别测试,获得训练好的目标分类模型的分类精度;

所述步骤2,对原始时域信号样本进行数据增强和扩充,在添加高斯噪声的基础上,对原始时域信号样本采用时域拉伸和音调变换的方式进行扩展,具体为:

针对原始时域信号样本添加均值为0、方差为1的高斯白噪声,之后分别对每个原始时域信号样本进行时域拉伸和音调变化,其中,时域拉伸的参数为{0.8,0.9,1.1,1.2};

所述步骤3,对扩展后原始时域信号样本提取Mel功率谱,采用随机时域掩蔽和频率掩蔽方式进行谱图数据的扩展,具体为:

针对原始时域信号样本提取的Mel功率谱,采用随机时频掩蔽的方式进行数据扩展,时间掩蔽为在Mel功率谱中使t个连续的时间步长[t0,t0+t)被图像均值掩蔽,其中,t0为起始时间,t为掩蔽时长,t0取值从[0,τ-t)的均匀分布中随机选择,τ为信号帧长,t取值从[0,T]的均匀分布中随机选择;

频率掩蔽为在Mel功率谱中使f个连续的频率通道[f0,f0+f)被图像均值掩蔽,其中,f0为起始频率,f为掩蔽频段,f0取值从[0,υ-f)的均匀分布中随机选择,υ是Mel功率谱的总频带数,f取值从[0,F]的均匀分布中随机选择;

每帧信号Mel功率谱图的时间掩蔽数Nt=4,频率掩蔽数Nf=4,得到8倍的基于Mel功率谱的数据扩展结果,即扩展后的Mel功率谱。

2.如权利要求1所述的方法,其特征在于,所述步骤1中,获取不同目标类别的水声信号作为样本,对水声信号样本按照预设的时间步长进行分帧,得到原始时域信号X(n),据此构建训练集和测试集,具体为:

S101、对水听器采集的水声信号进行预处理,去除空白信号,得到水声信号样本,将水声信号样本按照5s时长进行分帧和标注,生成原始时域信号;

S102:、将原始时域信号样本进行随机划分,70%的原始时域信号样本取出作为训练集,30%的原始时域信号样本为测试集。

3.如权利要求2所述的方法,其特征在于,所述步骤3中,将扩展后的Mel功率谱进行归一化处理,具体为:

将扩展后的Mel功率谱按照相同的尺寸进行裁剪并进行归一化处理,裁剪尺寸为(128,200),对添加类别标注后作为待识别水声信号的频谱特征。

4.如权利要求3所述的方法,其特征在于,所述步骤5中,所述根据预设的频段划分界限将待识别水声信号的频谱特征划分为低频特征和高频特征,具体为:

将待识别水声信号的频谱特征的[0,64)维选择为低频特征,将[64,128)维选择为高频特征。

5.如权利要求4所述的方法,其特征在于,所述步骤5中,在进行目标分类模型训练时,两个独立的CNN网络选择为ResNet;

在CNN网络中,通过对池化层下采样操作进行改进,在频率轴方向不进行下采样,在时间轴进行下采样到1维,使得网络模型可学习到全局时间范围内的多频段特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院,未经中国人民解放军军事科学院国防科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011063007.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top