[发明专利]一种基于卷积注意力模型的皮肤病变分割方法有效
申请号: | 202010782877.6 | 申请日: | 2020-08-06 |
公开(公告)号: | CN113744178B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 蒋芸;曹思敏;陶生鑫;吴超;刘文欢 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T7/90;G06T3/40;G06V10/82;G06V10/774;G06N3/0464;G06N3/084 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 江舟 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 注意力 模型 皮肤 病变 分割 方法 | ||
1.一种基于卷积注意力模型的皮肤病变分割方法,该分割方法具体按以下步骤:
步骤1:选取ISIC-2017数据集和PH2数据集:
ISIC-2017数据集包含8位RGB皮肤镜检查图像,图像大小从540×722-4499×6748像素不等,数据集提供2000张训练图像、用于验证的150张图像的单独数据集以及用于测试的600张图像的单独数据集,数据集中所有皮肤镜检查图像分别被标记为良性痣、黑色素瘤或脂溢性角化病,PH2数据集包含200张图像,其中160张图像为痣,分为普通痣和非典型性痣,其余40张图像为黑色素瘤,PH2数据集中的图像是大小固定为768×560像素的8位RGB图像,在相同条件下使用20倍放大倍数采集;
步骤2:数据预处理:
将ISIC-2017数据集中的2000张训练图像与150张测试图像合并,生成2150张皮肤镜检查图像的训练数据集,为了了解不同的色彩空间特征,在以RGB形式存在的2150张皮肤镜检查图像上增加色相饱和度值的三个通道,生成2150张HSV形式的皮肤镜检查图像,利用水平旋转、垂直旋转、水平垂直旋转这三种旋转方式随机生成样本,使得训练数据集拥有17200张皮肤镜图像,每个样例的右上为水平旋转、左下为垂直旋转、右下为水平垂直旋转,由于原始图像大小从540×722-4499×6748像素,按照原始图像的宽高比将图像的宽调整为256px,图像上下填充黑边,将高增加到256px,以此来组成训练图像;
步骤3:训练卷积神经网络模型:
建立网络模型,该网络模型是一个端到端的多标签深度网络,由多个注意力模块、多尺度输入层、U型卷积网络以及侧输出层组成:
注意力模块:网络模型利用卷积注意力模块提取图像特征,每个卷积注意力模块由固定模式的1×1、3×3、1×1卷积层、通道注意力模块和空间注意力模块依次堆叠;
在通道注意力模块中,利用特征通道间关系生成通道注意图,将输入特征FC∈RC×H×W,通过使用平均池化和最大池化操作来聚合特征图的空间信息,生成平均池化特征和最大池化特征,将生成的两个特征传送到由Fc1层、Relu激活函数和Fc2层组成的多层感知器中进行维度变换和矩阵乘积,获得两个通道的关联强度,分别输出特征图和然后对通道间的注意力特征图使用逐元素求和,使得各个通道之间能产生全局的关联,以进一步增强特征表示,合并输出的特征图XC,如公式(1)所示,再经过sigmoid操作获得最终输出的通道注意力特征图AC如等式(2)所示:
(1)式和(2)式中,表示逐元素相加;C表示通道个数;Xi,1,1表示坐标为(i,1,1)的元素;∪表示逐元素拼接;
在空间注意力模块中,将原始特征FS∈RC×H×W,沿通道轴使用平均池化和最大池化操作汇总特征图的通道信息,以生成两个二维特征图,再对特征进行加权融合,这样对于各个位置的点,其通过注意力图在全局空间中融合相似特征,之后利用卷积层生成2D空间注意图为:
(3)式中,W,b分别表示MLP的权重,MLP的偏置;Cat(.)表示拼接;Conv(.)表示卷积操作,其中C、H、W分别表示特征图的通道数、宽及高,里的W表示Weight,Xs∈R1×H×W里的W表示width;
最后再经过sigmoid操作,获得最终输出的空间注意力特征图AS为:
其中,m,n分别表示mthposition和nthposition;∪表示逐元素拼接;
其中编码器路径:利用注意力模块提取特征信息,使用步长为2的3×3卷积替代下采样中的池化操作,在每层的卷积操作后使用批量标准化层对每个层特征图进行归一化,然后使用带泄露整流激活函数将其激活,在编码器路径中,建立了多尺度输入层,利用注意力模块块提取特征信息,使用步长为2的3×3卷积替代下采样中的池化操作,将多尺度输入建立于图像进行下采样过程的编码路径中,给定输入尺寸为256×256的原始图像,经过三次下采样过程分别获得128×128、64×64和32×32三个不同尺寸的图像,与原始图像结合形成图像金字塔;
其中解码器路径:利用步长为2的3×3反卷积层、批量标准化层以及注意力模块输出解码器每层的特征图,提取每层注意力模块输出特征图,使用双线性插值法将其扩展到原输入图像大小,采用卷积操作完成多尺度特征融合输出对应层预测图,并将这些预测图相加后形成最终的预测图;
其中侧输出层:使用双线性插值法将输出特征图扩展到输入图像大小并采用步长为2的3×3卷积将每层多通道特征图转化为2通道特征图,实现降维操作,每层输出图像使用交叉熵损失函数来计算输出损失,对于样本(x,y),x=﹛xi,i=1,…,N﹜表示为训练数据,y=﹛yi,i=1,…,N﹜为对应的标注数据,其中yi=﹛0,1﹜,第i个样本被预测为1的概率为yp,N表示样本的总数,M表示多尺度输出层数,此时M=5,每个多输出层的相应损失权重表示为ai=﹛ai,i=1,…,M﹜,并且ai=﹛0.1、0.1、0.1、0.1、0.6﹜,对于每个输出图像,分别计算损耗L,L定义为:
叠加每个输出层的L(N),最终的输出损耗函数L为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010782877.6/1.html,转载请声明来源钻瓜专利网。