[发明专利]基于轻量级的递归式非局部自注意力的图像分割方法在审
申请号: | 202011261240.9 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112132844A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 聂若峰;浦佳祺;童同;高钦泉 | 申请(专利权)人: | 福建帝视信息科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/46 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350002 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 轻量级 递归 局部 注意力 图像 分割 方法 | ||
本发明涉及一种基于轻量级的递归式非局部自注意力的图像分割方法,包括以下步骤:步骤S1:采集人像分割数据,并预处理,得到人像分割数据集;步骤S2:构建基于轻量级的递归式非局部自注意力的图像分割模型;步骤S3:基于人像分割数据集,采用二进制交叉熵损失函数并反向传播损失梯度,并根据预设的训练学习率、优化器与学习率策略,训练至模型收敛;步骤S4:将待测图像进行归一化处理后输入训练后的图像分割模型,得到人像分割图。本发明能够有效实现人像分割,成像效果显著提升。
技术领域
本发明涉及计算机视觉与图像处理领域,具体涉及一种基于轻量级的递归式非局部自注意力的图像分割方法。
背景技术
基于深度学习的计算机视觉方法普遍基于卷积操作进行局部特征提取,通过堆叠一定量的卷积层来逐步扩充感受野,完成由局部的形状与细节特征提取逐步向相对高层的全局与语义信息提取的过渡,但仅采用卷积层进行特征提取存在两个明显缺陷:一,高分辨率输入图像需要经过足够深的网络才能扩展其理论感受野,从而捕获全局或长程的特征信息,这需要极大的计算量开销;二,深层网络通过卷积层逐步扩展感受野,未采用显式方式建模长程特征,故不能很好地获取并处理长程的特征相互依赖关系,对形状与分布具有结构性的目标或场景存在其固有的短板。(长程特征:long-range feature)
受启发于经典图像处理中的非局部均值图像去噪方法,FAIR(Facebook AI Research)提出Non-local Neural Networks[1]方法,提出将空间中任一位置像素(特征)值使用所有有效位置像素(特征)值对其的互相关归一化注意力进行加权表征,作为一个即插即用的模块来替代卷积模块,显著提升了视频分类的效果,并展示了其在目标检测与实例分割中的通用性。但该方法的瓶颈在于两点:(1)计算任一像素对所有像素的互相关矩阵,将消耗巨大的存储空间及计算量,(2)注意力在全局像素上的加权,同样需要消耗巨大的存储空间及计算量。
因此后续的工作不乏在减小计算开销上做权衡,如Attentional GAN方法采用推断时下采样特征图边长为1/K、计算非局部自注意力、放大加权特征图这一流程,该方法可以降低矩阵乘法计算量为(1/K)^4,但缺陷为有损的下采样将导致恢复的细节信息同样有损;如SAN方法采用将全局特征图划分为K*K的小块并堆叠到批量维度,使仅在每块中计算非局部自注意力,最后将小块由批量维度重组合至空间维度,该方法可以降低矩阵乘法计算量为(1/K)^2,当任务为超分等高分辨率输入时,K的较大取值可以让计算量获得相当可观的减少,但缺陷为分块操作的块大小(即SIZE/K)需要人为指定,并且(在其余任务中)分块与非局部的思想矛盾,是一种损失超出块尺度的长程依赖的折中方案。
递归型模块也在近年层出不穷,如ESRGAN方法提出的子模块Residual inResidual Dense Block(RRDB),其将一个Residual Dense Block(RDB)作为基础模块,将三个RDB堆叠并再次使用残差结构形成了递归型的RRDB模块;如[5]中U^2Net方法提出将U-Net直接作为基础模块,再使用U-Net模块组合为U-Net架构,构成UNet-In-UNet结构。
发明内容
有鉴于此,本发明的目的在于提供一种基于轻量级的递归式非局部自注意力的图像分割方法,能够有效实现人像分割,成像效果显著提升。
为实现上述目的,本发明采用如下技术方案:
一种基于轻量级的递归式非局部自注意力的图像分割方法,包括以下步骤:
步骤S1:采集人像分割数据,并预处理,得到人像分割数据集;
步骤S2:构建基于轻量级的递归式非局部自注意力的图像分割模型;
步骤S3:基于人像分割数据集,采用二进制交叉熵损失函数并反向传播损失梯度,并根据预设的训练学习率、优化器与学习率策略,训练至模型收敛;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建帝视信息科技有限公司,未经福建帝视信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011261240.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢筋定长自动剪断装置
- 下一篇:一种动脉穿刺定位仪及其使用方法