[发明专利]用于水下目标检测的检测网络的方法有效
申请号: | 201911303406.6 | 申请日: | 2019-12-17 |
公开(公告)号: | CN110956222B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 王智慧;李豪杰;刘崇威;王世杰;唐涛 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 水下 目标 检测 网络 方法 | ||
1.一种用于水下目标检测的检测网络的构建方法,其特征在于,所述的方法包括步骤:
1)构建MFF模块:对于一个输入张量,首先通过一个1×1卷积层将这个输入的通道扩大倍,是核序列中的数字个数;然后将输出沿通道方向等分为组,命名为;直接被相应的深度可分离卷积处理获得,然后的输出在被加上之后被相应的深度可分离卷积处理获得,,的核大小对应核序列中的第个数字;最后这些平行分支的输出被并联到一起然后再通过一个1× 1卷积层降维得到输出张量;还在MFF内使用了两处跳跃连接,一处是经过1× 1卷积层降维得到的输出张量上叠加输入张量得到最终输出;一处是在平行分支的输出被并联到一起获得的扩张张量上叠加被并联到一起获得的扩张张量;
2)构建MBP模块:对于一个输入张量,首先用一个步长为1的最大池化层对其进行处理,然后沿通道方向对输出进行3等分,对这3组依次进行核大小为3、5、7,步长为2的高斯模糊操作,最后将3组进行并联得到最终输出;
3)通过步骤1)、2)构建起来的MFF与MBP模块搭建UnderwaterNet;整个网络被分为编码和解码两个部分;对于编码器,使用步长为2的3×3的卷积作为第一层,然后是步长为1的3×3的卷积层;还利用了在第二个卷积层前后使用了跳跃连接;后4个Stage的结构是相同的,但配置不同;从Stage2到Stage4的核序列都被设置为[3,5,7],在Stage5中它们是[3,5,7,9];在解码器中,使用3个解码器逐步将分辨率恢复到输入分辨率的四分之一;每个解码器由一个3×3卷积层和一个双线性上采样层组成;三个解码器分别命名为Decoder1、Decoder2、和Decoder3;Decoder1接收Stage5的输出;Decoder1的输出和Stage4的输出叠加作为Decoder2的输入;Decoder2的输出和Stage3的输出叠加作为Decoder3的输入;
4)在步骤3)中的网络搭建好之后,采用CenterNet中的无锚方法来构造头部;头部由3部分组成:HeatMap,预测一个物体的中心;WHMap,预测物体的宽度和高度的;OffsetMap,预测一个物体的预测中心和真实中心之间的偏移量;每一部分都是由一个3×3卷积、ReLU和另一个1×1卷积层组成的;损失函数也与CenterNet相同;Decoder3的输出和Stage2的输出叠加作为头部的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911303406.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:子像素结构、显示面板及显示装置
- 下一篇:一种车载隔离型应急双向DCDC系统