[发明专利]万花筒卷积网络的构建方法有效
申请号: | 201911216109.8 | 申请日: | 2019-12-02 |
公开(公告)号: | CN110991617B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 陈曦;李志强;胡正欣;刘静静;刘敏;丁婕;侯宇飞 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张利明 |
地址: | 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 万花筒 卷积 网络 构建 方法 | ||
1.一种万花筒卷积网络的构建方法,其特征在于,包括以下步骤:
构建万花筒滤波器,使万花筒滤波器的外轮廓为正方形,将所述正方形均分为四个分割单元,由四个分割单元的四角确定九个一级采样点;再在每个分割单元中以万花筒式花瓣的交点位置确定三个二级采样点,其中一个二级采样点为分割单元的中点,另外两个二级采样点相对于所述一个二级采样点对称分布;
然后基于多个不同尺寸的所述万花筒滤波器构建万花筒级联空间金字塔池化模块;
最后,采用Xception作为主干网,并将万花筒级联空间金字塔池化模块组装在解码器层形成万花筒卷积网络;
所述万花筒卷积网络包括输入流程(200)、中间流程(300)以及输出流程(400);所述输入流程(200)、中间流程(300)及输出流程(400)构成主干网Xception,并作为万花筒卷积网络的编码器部分;
所述输入流程(200)包括一级处理(210)、二级处理(220)和三级处理(230),
所述一级处理(210)包括1层卷积核为3的普通卷积、2层卷积核为3的深度可分离卷积及1层卷积核为3步长为2的深度可分离卷积;待识别图像经过所述1层卷积核为3的普通卷积后,做步长为2的1*1卷积得到128维特征构成一级图像侧枝;所述待识别图像经一级处理(210)中所有卷积层卷积后获得一级图像主体,所述一级图像主体与一级图像侧枝逐像元相加得到一级处理特征图;所述二级处理(220)包括2层卷积核为3的深度可分离卷积,1层卷积核为3步长为2的深度可分离卷积;对一级处理特征图做步长为2的1*1卷积得到256维特征构成二级图像侧枝;所述一级处理特征图经二级处理(220)中所有卷积层卷积后获得二级图像主体;所述二级图像主体与二级图像侧枝逐像元相加得到二级处理特征图;所述三级处理(230)包括2层卷积核为3的深度可分离卷积及1层卷积核为3步长为2的深度可分离卷积;对二级处理特征图做步长为2的1*1卷积得到728维特征构成三级图像侧枝;所述二级处理特征图经三级处理(230)中所有卷积层卷积后获得三级图像主体;所述三级图像主体与三级图像侧枝逐像元相加得到三级处理特征图;所述中间流程(300)包括3层卷积核为3的深度可分离卷积,所述3层卷积核为3的深度可分离卷积构成卷积单元;采用卷积单元对三级处理特征图进行处理,获得的结果与所述三级处理特征图相加;重复16次得到中间流程输出结果;
所述输出流程(400)包括四级处理(410)及五级处理(420);
所述四级处理(410)包括2层卷积核为3的深度可分离卷积和1层卷积核为3步长为2的深度可分离卷积;对中间流程输出结果做步长为2的1*1卷积得到1024维特征构成四级图像侧枝;所述中间流程输出结果经四级处理(410)中所有卷积层卷积后获得四级图像主体;所述四级图像主体与四级图像侧枝逐像元相加得到四级处理特征图;
所述五级处理(420)包括3层卷积核为3的深度可分离卷积;四级处理特征图经五级处理(420)中所有卷积层卷积后获得2048维特征结果图;所述待识别图像为2048维特征结果图尺寸的256倍;
所述2048维特征结果图作为编码器部分的输出;
所述万花筒卷积网络的编码器部分还包括一级万花筒级联空间金字塔池化模块(510);
所述万花筒卷积网络还包括解码器(500),
所述一级处理特征图、二级处理特征图、三级处理特征图及2048维特征结果图作为解码器(500)的输入;
解码器(500)包括三个万花筒级联空间金字塔池化模块与三个解码RCS模块;2048维特征结果图经一级万花筒级联空间金字塔池化模块(510)处理后,经上采样至尺寸变为2048维特征结果图的两倍,获得一级上采样图像;
三级处理特征图经二级万花筒级联空间金字塔池化模块(520)处理后,获得二级万花筒图像;
所述二级万花筒图像与一级上采样图像逐像元相加,相加结果经一级解码RCS模块(550)获得一级解码图像;
一级解码图像经上采样至尺寸变为三级处理特征图的两倍,获得二级上采样图像;
二级处理特征图经三级万花筒级联空间金字塔池化模块(530)处理后,获得三级万花筒图像;所述三级万花筒图像与二级上采样图像逐像元相加,相加结果经二级解码RCS模块(560)获得二级解码图像;
二级解码图像经上采样至尺寸变为二级处理特征图的两倍,获得三级上采样图像;
一级处理特征图经四级万花筒级联空间金字塔池化模块(540)处理后,获得四级万花筒图像;所述四级万花筒图像与三级上采样图像逐像元相加,相加结果经三级解码RCS模块(570)获得三级解码图像;
所述三级解码图像经上采样至尺寸变为一级处理特征图的两倍,获得四级上采样图像;
所述四级上采样图像作为待识别图像的最终语义分割结果;
多个万花筒级联空间金字塔池化模块被组装到解码器层中以提取待识别图像的上下文特征、形状特征和纹理特征;
在超参数设置中,组装在编码器层中的万花筒滤波器的Rate设置为解码器层中相应万花筒滤波器的Rate的两倍或者三倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911216109.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无拓扑结构的社交消息传播范围预测方法
- 下一篇:激光测距装置和机器人