[发明专利]McNet分割网络架构方法在审
申请号: | 202011218833.7 | 申请日: | 2020-11-04 |
公开(公告)号: | CN112465107A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 高旭敏;刘龙;宫华泽;陈祺;张晟楠 | 申请(专利权)人: | 北京麦飞科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 张学府 |
地址: | 100000 北京市朝阳区阜*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | mcnet 分割 网络 架构 方法 | ||
1.McNet分割网络架构方法,其特征在于:所述McNet分割网络架构方法包括以下步骤:
S1:数据收集装置开始工作,对各项数据进行收集整理,并通过信息输入端输入到ImageNet数据集上;
S2:McNet分割网络以ImageNet数据集上预训练好的ResNeSt作为网络的encoder,极大地提高了网络特征的提取性能;
S3:在中心部分插入ASSP式dilated-convolution层,使得网络层次接收域更大且同时融合多尺度信息;
S4:网络层次接收域开始对整理接收到的融合多尺度信息进行分门别类的收集整理,
S5:decoder部分将不同scale的feature map相加融合作为最后的特征图,使得整个网络更加适应卫星遥感图像多尺度变化的特性。
2.如权利要求1所述的McNet分割网络架构方法,其特征在于:所述步骤S1中的ImageNet数据集就像一个网络一样,拥有多个节点;每一个节点相当于一个item或者subcategory;据官网消息,一个节点含有至少500个对应物体的可供训练的图片/图像;ImageNet对其注释过程进行了众包;图像级注释表示图像中存在或不存在对象类,例如“此图像中有物体”或“此图像中没有物体”;对象级注释提供了指定对象(的可见部分)周围的边界框;ImageNet使用广泛的WordNet架构的变体来对对象进行分类,增加了120种类别的扫描物体品种以展示细粒度的分类;WordNet使用的一个缺点是这些类别可能比ImageNet最适合的“提升”。
3.如权利要求1所述的McNet分割网络架构方法,其特征在于:所述步骤S2中的ImageNet数据集上的WordNet可以根据词条的意义将它们分组,每一个具有相同意义的字条组称为一个同义词集合;WordNet为每一个同义词集合提供了简短,概要的定义,并记录不同同义词集合之间的语义关系;WordNet中的每个有意义的概念(可能由多个单词或单词短语描述)被称为同义词集或同义词集合;ImageNet是根据WordNet层次结构组织的图像数据集;在ImageNet中,目标是为了说明每个同义词集合提供平均1000幅图像;每个concept图像都是质量控制和人为标注的(quality-controlled and human-annotated);在完成之后,希望ImageNet能够为WordNet层次结构中的大多数concept提供数千万个干净整理的图像(cleanly sortedimages);ImageNet是一项持续的研究工作,旨在为世界各地的研究人员提供易于访问的图像数据库;目前ImageNet中总共有14197122幅图像,总共分为21841个类别。
4.如权利要求1所述的McNet分割网络架构方法,其特征在于:所述步骤S2中,Resnet是每隔二层或三层进行的相加求下一步的输入,这是与VGG网络不同的,VGG主要是直接进行卷积,送入到下一层,同时每一层的核大小都是固定的,Resnet里面也采用了;Resnet网络结构的设计遵循两种设计规则:(1).对于相同的输出特征图尺寸,层具有相同数量的滤波器;(2).如果特征图大小减半,则滤波器的数量加倍,以便保持每一层的时间复杂度;使用快捷连接要保证输入和输出具有相同的维度;当我们在进行两种维度的跨越进行连接的时候,有两种方式可以进行,第一种额外的进行填充零输入,增加维度;第二种方式:用1x1卷积核,步长为2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京麦飞科技有限公司,未经北京麦飞科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011218833.7/1.html,转载请声明来源钻瓜专利网。