[发明专利]一种基于深度学习模型的逐级交互式轮廓识别方法有效
申请号: | 202110953747.9 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113673539B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 林川;庞晨;谢智星;张贞光;古家虹;陈永亮;乔亚坤;吴海晨;李福章;潘勇才;韦艳霞 | 申请(专利权)人: | 广西科技大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 周晟 |
地址: | 545006 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 模型 逐级 交互式 轮廓 识别 方法 | ||
本发明旨在提供一种基于深度学习模型的逐级交互式轮廓识别方法,包括以下步骤:A、构建深度神经网络结构,结构具体如下:编码网络、解码网络;其中,编码网络为VGG16网络,池化层为分界线分为S1、S2、S3、S4、S5五个阶段;所述的解码网络分为四级,每一级中均分别设有子解码网络M和子解码网络N;B、原始图像输入VGG16网络中,依次经五个阶段卷积处理;C、VGG16网络的S1、S2、S3、S4、S5五个阶段中的第一卷积层和第二卷积层的卷积结果分别输入子解码网络M和N中,经过双解码网络解码之后,最后融合处理得到最终输出轮廓。本发明对纹理的抑制、边缘的保护产生了积极的效果。
技术领域
本发明涉及图像处理领域,具体涉及一种基于深度学习模型的逐级交互式轮廓识别方法。
背景技术
初期的轮廓检测模型大多基于局部像素值梯度的变化方向以确定目标边界位置,这是一种普适性方法,可以有效的检测目标/非目标的全部边界信息。后来,模拟生物视觉的数学模型开始被应用于轮廓检测任务,研究者根据生物视觉的工作机制建立模型,通过采用特定的函数来模拟细胞的功能。近几年,深度学习算法开始被应用于各类计算机视觉任务中,研究者发现卷积神经网络(Convolutional Neural Networks,CNNs)在轮廓检测任务上表现出优异的性能。CNNs模型通常分为编码和解码两个部分,编码网络采用多卷积层构建深度模型以获取图像特征,解码网络则对编码中提取的特征信息进行融合、解析来获取所需的任务对象。
发明内容
本发明旨在提供一种基于深度学习模型的逐级交互式轮廓识别方法,该方法采用双解码网络以利用编码中更多的特征信息,逐级交互式解码可以使不同网络中的信息相互交流,对纹理的抑制、边缘的保护产生了积极的效果。
本发明的技术方案如下:
所述的基于深度学习模型的逐级交互式轮廓识别方法,包括以下步骤:
A、构建深度神经网络结构,深度神经网络结构具体如下:
编码网络、解码网络;
其中,编码网络为VGG16网络,池化层为分界线分为S1、S2、S3、S4、S5五个阶段;
所述的解码网络分为四级,每一级中均分别设有子解码网络M和子解码网络N;
第一级的子解码网络M和子解码网络中均设有4个融合模块R,第二级的子解码网络M和子解码网络中均设有3个融合模块R,第三级的子解码网络M和子解码网络中均设有2个融合模块R,第四级的子解码网络M和子解码网络中均设有1个融合模块R;
B、原始图像输入VGG16网络中,依次经五个阶段卷积处理;
C、VGG16网络的S1、S2、S3、S4、S5五个阶段中的第一卷积层的卷积结果分别输入子解码网络M中,依次经过四级融合处理,获得融合结果4thI1;
VGG16网络的S1、S2、S3、S4、S5五个阶段中的第二卷积层的卷积结果分别输入子解码网络N中,依次经过四级融合处理,获得融合结果4thI2;
D、将融合结果4thI1和融合结果4thI2通过加法层融合得到最终输出轮廓。
所述的VGG16网络由原始VGG16网络舍弃3个全连接层和最后1个下采样层后获得。
所述的融合模块R包括1×1卷积层、上采样层、3×3卷积层、加法层;
上层的输入信息经1×1卷积层处理后,获得相应的上层卷积结果;其中1×1卷积层的通道数与上层的输入信息的通道数一致;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西科技大学,未经广西科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110953747.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大容量瓶的双轨道拉伸吹瓶机
- 下一篇:一种市政用道路铺砖装置