[发明专利]一种基于注意力的卷积神经网络优化方法在审
申请号: | 201810519139.5 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108875592A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 王红滨;王勇军;何鸣;王念滨;周连科;陈田田;秦帅;赵昱杰;李秀明;薛冬梅 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 矢量化数据 水下目标 噪声数据 定长 水听 优化 输入数据集 注意力模型 结果分析 目标噪声 排布位置 时序关系 实验过程 训练网络 识别率 拼接 分段 注意力 试验 学习 图片 | ||
本发明提供的是一种基于注意力模型的卷积神经网络优化方法。首先对水下目标的噪声数据进行分段,针对每段噪声数据提取其MFCC,其目的是将目标噪声数据变成定长的矢量化数据。然后,将得到的定长的矢量化数据按实验过程中水听器的排布位置以及其时序关系进行拼接,形成一个完整的时段水听阵特征,继而再将形成的水听阵特征转成对应的图片以作为输入数据集输入到训练网络中。本发明通过试验对模型在使用情况的结果分析以及对模型进行修改与优化,深度学习对水下目标识别识别率的得到10%‑15%的提升。
技术领域
本发明涉及的是一种水下目标识别方法。
背景技术
水声信号处理和声纳技术是一门发展迅速、需求推动力强大、应用前景异常广阔的学科,是现代声纳系统与水声对抗的一个重要的组成部分,一直以来受到许多学者、工程技术人员的极大关注。各种水下目标都具有其自身特有的噪声特性,可用于目标识别、分类、状态监测等等应用领域。由于海洋环境的复杂性和水声信号通道的特殊性,要从目标噪声信号中抽取一种既能反映目标本质特征又能满足水下远距离探测要求的有效特征表示,一直是这一领域的难题。
传统的水下目标识别解决方案多从水下目标的低频信息入手,基于目标的DEMON与LOFAR 谱进行分析得出目标的类属。
发明内容
本发明的目的在于提供一种可以快速的对模型进行降维操作从而降低过拟合风险的基于注意力模型的卷积神经网络优化方法。
本发明的目的是这样实现的:
(1)噪声数据的切分
所述噪声数据的切分是对水下目标的噪声数据以100ms为单位进行分段;
(2)数据特征的提取
所述数据特征的提取是针对每段噪声数据提取其MFCC,MFCC的提取过程如公式为:
式中,f为目标噪声频率,mel(f)为所示目标噪声提取的梅尔倒谱系数;
(3)多路数据拼接
将水下目标噪声数据分段并进行数据特征的提取后,结合水听器的组阵位置,组成相应的向量矩阵,同时,不同的时序数据组成不同批次的数据,每段噪声数据通过上一步得到的 MFCC按多路水听器的排放位置以及每段噪声数据的时序关系进行拼接,形成深度学习模型输入数据集;
(4)基于注意力模型加速池化操作
使用卷积模型处理水下目标噪声数据,在卷积结构的处理方法中注意力被定义为相应卷积层中卷积操作后的特征图,通过主成分分析的方法确定特征图的降维方向,在提取卷积核的特征的基础上进行池化;
(6)注意力加权连接
利用卷积核特征将卷积神经网络提取的特征,即最后一层结果,基于注意力模型进行加权处理。
在卷积神经网络中通过卷积操作获得特征之后,会利用这些特征去做分类。理论上讲,可以直接使用所有提取得到的特征去训练分类器,但如果直接训练的话会面临极大的计算量挑战。研究人员从生物学得到的启发,利用人类在图像识别与分类时具有的“静态性”的属性,对不同位置的特征进行聚合统计,这些概要统计特征不仅具有较低的维度,同时还会防止过拟合。但是传统的池化策略的问题是所有池化策略都是固定的,即池化操作在参与模型训练时只是单纯的粗暴地对上一层卷积结果进行降维。本发明提出了一种结合卷积神经网络和注意力模型的池化与拼接结构,分为层间注意力池化模型与面向全连接层的特征拼接的注意力拼接模型。可以快速的对模型进行降维操作从而降低模型的过拟合风险。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810519139.5/2.html,转载请声明来源钻瓜专利网。