[发明专利]一种基于听觉感知特征深度学习的水声目标识别方法有效
申请号: | 202011397588.0 | 申请日: | 2020-12-04 |
公开(公告)号: | CN113191178B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 陈越超;王方勇;尚金涛 | 申请(专利权)人: | 中国船舶重工集团公司第七一五研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06F17/14 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 陈继亮 |
地址: | 311499 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 听觉 感知 特征 深度 学习 目标 识别 方法 | ||
1.一种基于听觉感知特征深度学习的水声目标识别方法,其特征在于:首先对水中目标辐射噪声数据进行预处理,基于听觉感知方法,生成MFCC谱图和GFCC谱图作为深度学习处理对象,其次针对以上听觉感知谱图,分别构建深层网络模型进行处理,输出各类目标识别置信度;接着对多模型置信度结果进行加权联合判决,基于梯度下降方法对多模型置信度结果实现加权系数,最后基于上述模型和准则实现未知目标噪声数据识别;具体步骤如下:
(1)基于带标签水声目标噪声数据构建MFCC谱图和GFCC谱图样本集,基本过程如下:
(1.1)对水声目标噪声数据按分辨率需求进行分帧和加窗,形成标准长度的信号片段;
(1.2)构建MFCC谱图样本集,具体构建方式如下;
(1.2.1)对单帧信号进行快速傅里叶变换;
(1.2.2)设计Mel滤波器组,根据信号特点确定上限频率、下限频率、滤波器数量相关参数,形成滤波器组;
(1.2.3)对快速傅里叶变换后的频谱基于Mel滤波器组进行滤波;
(1.2.4)对Mel滤波器组输出的幅值作对数运算,得到频域输出的对数分布;
(1.2.5)对信号进行离散余弦变换,得到MFCC谱图;
(1.2.6)重复(1.2.1)~(1.2.5)过程,对其余信号帧进行处理,形成MFCC谱图样本集;
(1.2.7)基于随机不放回方式取样方式,对MFCC谱图样本集中的每类目标样本按一定比例划分为训练样本子集和交叉验证样本子集;
(1.3)构建GFCC谱图样本集,具体构建方式如下:
(1.3.1)对单帧信号进行快速傅里叶变换;
(1.3.2)设计Gammatone滤波器组,根据信号特点确定上限频率、下限频率、滤波器数量相关参数,形成滤波器组;
(1.3.3)对快速傅里叶变换后的频谱基于Gammatone滤波器组进行滤波;
(1.3.4)对Gammatone滤波器组输出的幅值作指数压缩,得到对数能量谱;
(1.3.5)对信号进行离散余弦变换,得到GFCC谱图;
(1.3.6)重复(1.3.1)~(1.3.5)过程,对其余信号帧进行处理,形成MFCC谱图样本集;
(1.3.7)基于随机不放回方式取样方式,对GFCC谱图样本集中的每类目标样本按一定比例划分为训练样本子集和交叉验证样本子集;
(2)基于TensorFlow框架构建用于目标噪声听觉感知谱图识别的深层网络模型,基本过程如下:
(2.1)构建基本卷积模块,具体构建方式如下:在数据输入层之后添加3个并行分支,分支1为直接分支,不添加任何操作;分支2包括4个卷积层,卷积层1参数为(1×1,x,1),即卷积核尺寸为1×1,卷积核数量根据需求进行设定,卷积步长为1,表示方法下同;卷积层2~4的参数依次为(1×3,x,1),(3×1,2x,1)和(1×1,nx,1或2);分支2包括3个卷积层,各卷积层参数依次为(1×1,x,1),(3×3,x,1)和(1×1,nx,1或2);在3个并行分支之后添加网络整合层,实现卷积特征组合;
(2.2)构建面向MFCC谱图识别的深层网络模型,具体构建方式如下:
(2.2.1)添加数据输入层,输入数据尺寸为48×48×1;
(2.2.2)添加卷积层,参数为(5×5,64,2),各数字依次为卷积核尺寸、输出通道数量和步长值,下同;
(2.2.3)添加卷积层,参数为(3×3,64,2);
(2.2.4)添加基本卷积模块,参数为(2,64,4,1),各数字依次为模块数量、x值、n值和中间卷积层步长值,需设置的中间卷积层,下同;
(2.2.5)添加基本卷积模块,参数为(1,128,4,2);
(2.2.6)添加基本卷积模块,参数为(2,128,4,1);
(2.2.7)添加基本卷积模块,参数为(1,256,4,2);
(2.2.8)添加基本卷积模块,参数为(4,256,4,1);
(2.2.9)添加基本卷积模块,参数为(1,512,4,2);
(2.2.9)添加全局平均池化层;
(2.2.10)添加Softmax分类器;
(2.3)构建面向GFCC谱图识别的深层网络模型,具体构建方式参照步骤(2.2.1)~(2.2.10);
(3)对建立的深层网络模型进行训练,基本过程如下:
(3.1)对面向MFCC谱图识别的深层网络模型进行训练,基本过程如下:
(3.1.1)设定深层网络模型训练参数,包括学习率、优化器,损失函数设置为交叉熵函数;
(3.1.2)设定顺序取样轮次和随机放回取样次数;
(3.1.3)从MFCC谱图样本集的训练样本子集中按顺序取出一定数量样本;
(3.1.4)针对输入样本,对深层网络模型作前向计算,得到最后分类结果;
(3.1.5)基于梯度下降算法最小化分类结果与对应样本标签之间的误差;
(3.1.6)重复步骤(3.1.3)~(3.1.5),直至完成设定的循环取样轮次;
(3.1.7)从MFCC谱图样本集的训练样本子集中按随机放回方式取出一定数量样本;
(3.1.8)重复步骤(3.1.3)~(3.1.5),直至完成设定的随机放回取样次数;
(3.2)对面向GFCC谱图识别的深层网络模型进行训练,基本过程与面向MFCC谱图识别的深层网络模型训练方法相同;
(4)计算多深层网络模型融合判决系数,基本过程如下;
(4.1)基于面向MFCC谱图识别的深层网络模型对MFCC谱图样本集的交叉验证样本子集中的数据按次序进行处理,输出置信度,得到集合CMFCC(cMFCC,1,cMFCC,2,...,cMFCC,n),其中cMFCC,n表示第n类结果的置信度,下同;
(4.2)基于面向GFCC谱图识别的深层网络模型对GFCC谱图样本集的交叉验证样本子集中的数据按次序进行处理,输出置信度,得到集合CGFCC(cGFCC,1,cGFCC,2,...,cGFCC,n),其中cGFCC,n表示第n类结果的置信度,下同;
(4.3)构建融合判决置信度计算模型,综合置信度计算方法如下所示
其中,αn,βn分别为面向MFCC谱图识别的深层网络模型、面向GFCC谱图识别的深层网络模型对第n类目标分类置信度的加权系数,针对Cclass,n,取综合置信度最大值为识别类别;
(4.4)基于梯度下降算法对融合判决置信度计算模型的加权系数进行优化,设置目标函数为max{Cclass},决策变量为所有决策变量上界和下界均分别设置为1和0;
(4.5)对建立的融合判决置信度计算模型进行迭代寻优,得到最佳加权系统组合;
(5)对未知水中目标辐射噪声数据进行识别,基本过程如下:
(5.1)对水中目标辐射噪声数据进行预处理,生成若干帧MFCC谱图和GFCC谱图样本;
(5.2)基于面向MFCC谱图识别的深层网络模型和面向GFCC谱图识别的深层网络模型分别对MFCC谱图和GFCC谱图进行处理,生成各模型的置信度列表;
(5.3)通过对置信度列表进行加权融合判决,得到各帧谱图的识别结果;
(5.4)统计所有帧谱图的识别结果,输出最终的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七一五研究所,未经中国船舶重工集团公司第七一五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011397588.0/1.html,转载请声明来源钻瓜专利网。