[发明专利]基于双向自适应语义融合的水下目标识别方法有效
申请号: | 201810107755.X | 申请日: | 2018-02-02 |
公开(公告)号: | CN108447074B | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 李学龙;卢孝强;孙昊 | 申请(专利权)人: | 中国科学院西安光学精密机械研究所 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 杨引雪 |
地址: | 710119 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 自适应 语义 融合 水下 目标 识别 方法 | ||
1.一种基于双向自适应语义融合的水下目标识别方法,其特征在于,包括以下步骤:
1)构建深层的卷积神经网络,学习水下图像的语义特征;
利用卷积模块搭建卷积神经网络框架,并使用带动量的随机梯度下降法优化卷积神经网络,让卷积神经网络学习出水下图像的语义特征;
2)构建双向自适应语义特征融合模块;
将卷积神经网络不同卷积层的语义特征进行双向地自适应融合,得到对不同尺度目标均具有判别性的混合语义特征;
3)构建回归模型;
对得到的混合语义特征构建回归模型,使用带动量的随机梯度下降法优化回归模型;
4)预测水下图像中目标位置及其类别;
输入水下图像至训练好的卷积神经网络中,得到水下图像所包含的目标位置信息以及类别信息。
2.根据权利要求1所述的基于双向自适应语义融合的水下目标识别方法,其特征在于,步骤1)具体为:
构建深层的卷积神经网络,卷积神经网络的输入为448×448尺寸的水下图像,经过卷积模块后得到水下图像的语义特征,所述卷积模块由卷积层、激活层、采样层组成:
xi=σ(wi*xi-1+bi)
其中,xi表示水下图像在i卷积模块的语义特征,即第i卷积模块的输出,i=1,2,3,…,x0表示448×448尺寸的水下图像,wi和bi分别表示第i卷积层的权重和偏置,使用服从高斯分布随机数初始化,“*”表示卷积运算,σ(x)=max(0,x)是激活函数。
3.根据权利要求2所述的基于双向自适应语义融合的水下目标识别方法,其特征在于,步骤2)具体为:
2.1)分别取卷积神经网络低层x7、中层x10、高层x13的卷积特征,并分别改记为使用双线性插值统一卷积特征大小,使得M,N和C分别表示卷积特征的宽、高和通道数;
2.2)建立自上而下自适应特征融合模块,利用门函数使高层卷积特征自适应地融合入低层卷积特征中,得到低层特征主导的特征
其中,表示自上而下自适应特征融合过程中的卷积特征,sig(x)=(1+exp(-x))-1是门函数,和是卷积参数,使用服从高斯分布随机数初始化,“·”表示矩阵点乘运算;
2.3)建立自下而上自适应特征融合模块,将低层卷积特征自适应地融合入高层卷积特征中,得到高层特征主导的特征
其中,是自下而上自适应特征融合过程中的卷积特征,和是卷积参数,使用服从高斯分布随机数初始化;
2.4)建立双线性特征融合模块,利用双线性操作将和融合为对水下不同尺度目标均具有判别性的混合语义特征
其中,表示外积运算,表示xb在第i个位置的混合语义特征。
4.根据权利要求3所述的基于双向自适应语义融合的水下目标识别方法,其特征在于,步骤3)具体为:
对混合语义特征xb再进行一次卷积操作得到包含水下图像中目标的位置和类别信息:
其中,wb和bb分别为卷积权重参数和偏置,使用服从高斯分布随机数初始化,表示中第i个位置的数值向量,cxi,cyi,mi,ni,ci分别表示中第i个位置包含目标的外接矩形框的中心横坐标、纵坐标、宽、高、包含目标的置信度,pi是类别信息向量,用于判断第i个位置所包含目标的类别,构建如下损失函数:
其中,是训练集中真实的第i个位置包含目标的信息,是训练集中真实的第i个位置包含目标的类别标签,λcoord和λnoobj为超参数,分别设置为5和0.5,表示第i个位置是否包含目标,
使用带动量的随机梯度下降法优化上述回归模型,直至最大迭代次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院西安光学精密机械研究所,未经中国科学院西安光学精密机械研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810107755.X/1.html,转载请声明来源钻瓜专利网。