[发明专利]一种基于卷积注意力模型的皮肤病变分割方法有效

专利信息
申请号: 202010782877.6 申请日: 2020-08-06
公开(公告)号: CN113744178B 公开(公告)日: 2023-10-20
发明(设计)人: 蒋芸;曹思敏;陶生鑫;吴超;刘文欢 申请(专利权)人: 西北师范大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/11;G06T7/90;G06T3/40;G06V10/82;G06V10/774;G06N3/0464;G06N3/084
代理公司: 北京同辉知识产权代理事务所(普通合伙) 11357 代理人: 江舟
地址: 730070 甘肃*** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 注意力 模型 皮肤 病变 分割 方法
【权利要求书】:

1.一种基于卷积注意力模型的皮肤病变分割方法,该分割方法具体按以下步骤:

步骤1:选取ISIC-2017数据集和PH2数据集:

ISIC-2017数据集包含8位RGB皮肤镜检查图像,图像大小从540×722-4499×6748像素不等,数据集提供2000张训练图像、用于验证的150张图像的单独数据集以及用于测试的600张图像的单独数据集,数据集中所有皮肤镜检查图像分别被标记为良性痣、黑色素瘤或脂溢性角化病,PH2数据集包含200张图像,其中160张图像为痣,分为普通痣和非典型性痣,其余40张图像为黑色素瘤,PH2数据集中的图像是大小固定为768×560像素的8位RGB图像,在相同条件下使用20倍放大倍数采集;

步骤2:数据预处理:

将ISIC-2017数据集中的2000张训练图像与150张测试图像合并,生成2150张皮肤镜检查图像的训练数据集,为了了解不同的色彩空间特征,在以RGB形式存在的2150张皮肤镜检查图像上增加色相饱和度值的三个通道,生成2150张HSV形式的皮肤镜检查图像,利用水平旋转、垂直旋转、水平垂直旋转这三种旋转方式随机生成样本,使得训练数据集拥有17200张皮肤镜图像,每个样例的右上为水平旋转、左下为垂直旋转、右下为水平垂直旋转,由于原始图像大小从540×722-4499×6748像素,按照原始图像的宽高比将图像的宽调整为256px,图像上下填充黑边,将高增加到256px,以此来组成训练图像;

步骤3:训练卷积神经网络模型:

建立网络模型,该网络模型是一个端到端的多标签深度网络,由多个注意力模块、多尺度输入层、U型卷积网络以及侧输出层组成:

注意力模块:网络模型利用卷积注意力模块提取图像特征,每个卷积注意力模块由固定模式的1×1、3×3、1×1卷积层、通道注意力模块和空间注意力模块依次堆叠;

在通道注意力模块中,利用特征通道间关系生成通道注意图,将输入特征FC∈RC×H×W,通过使用平均池化和最大池化操作来聚合特征图的空间信息,生成平均池化特征和最大池化特征,将生成的两个特征传送到由Fc1层、Relu激活函数和Fc2层组成的多层感知器中进行维度变换和矩阵乘积,获得两个通道的关联强度,分别输出特征图和然后对通道间的注意力特征图使用逐元素求和,使得各个通道之间能产生全局的关联,以进一步增强特征表示,合并输出的特征图XC,如公式(1)所示,再经过sigmoid操作获得最终输出的通道注意力特征图AC如等式(2)所示:

(1)式和(2)式中,表示逐元素相加;C表示通道个数;Xi,1,1表示坐标为(i,1,1)的元素;∪表示逐元素拼接;

在空间注意力模块中,将原始特征FS∈RC×H×W,沿通道轴使用平均池化和最大池化操作汇总特征图的通道信息,以生成两个二维特征图,再对特征进行加权融合,这样对于各个位置的点,其通过注意力图在全局空间中融合相似特征,之后利用卷积层生成2D空间注意图为:

(3)式中,W,b分别表示MLP的权重,MLP的偏置;Cat(.)表示拼接;Conv(.)表示卷积操作,其中C、H、W分别表示特征图的通道数、宽及高,里的W表示Weight,Xs∈R1×H×W里的W表示width;

最后再经过sigmoid操作,获得最终输出的空间注意力特征图AS为:

其中,m,n分别表示mthposition和nthposition;∪表示逐元素拼接;

其中编码器路径:利用注意力模块提取特征信息,使用步长为2的3×3卷积替代下采样中的池化操作,在每层的卷积操作后使用批量标准化层对每个层特征图进行归一化,然后使用带泄露整流激活函数将其激活,在编码器路径中,建立了多尺度输入层,利用注意力模块块提取特征信息,使用步长为2的3×3卷积替代下采样中的池化操作,将多尺度输入建立于图像进行下采样过程的编码路径中,给定输入尺寸为256×256的原始图像,经过三次下采样过程分别获得128×128、64×64和32×32三个不同尺寸的图像,与原始图像结合形成图像金字塔;

其中解码器路径:利用步长为2的3×3反卷积层、批量标准化层以及注意力模块输出解码器每层的特征图,提取每层注意力模块输出特征图,使用双线性插值法将其扩展到原输入图像大小,采用卷积操作完成多尺度特征融合输出对应层预测图,并将这些预测图相加后形成最终的预测图;

其中侧输出层:使用双线性插值法将输出特征图扩展到输入图像大小并采用步长为2的3×3卷积将每层多通道特征图转化为2通道特征图,实现降维操作,每层输出图像使用交叉熵损失函数来计算输出损失,对于样本(x,y),x=﹛xi,i=1,…,N﹜表示为训练数据,y=﹛yi,i=1,…,N﹜为对应的标注数据,其中yi=﹛0,1﹜,第i个样本被预测为1的概率为yp,N表示样本的总数,M表示多尺度输出层数,此时M=5,每个多输出层的相应损失权重表示为ai=﹛ai,i=1,…,M﹜,并且ai=﹛0.1、0.1、0.1、0.1、0.6﹜,对于每个输出图像,分别计算损耗L,L定义为:

叠加每个输出层的L(N),最终的输出损耗函数L为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010782877.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top