[发明专利]一种基于卷积注意力模型的皮肤病变分割方法有效

申请号：	202010782877.6	申请日：	2020-08-06
公开（公告）号：	CN113744178B	公开（公告）日：	2023-10-20
发明（设计）人：	蒋芸;曹思敏;陶生鑫;吴超;刘文欢	申请（专利权）人：	西北师范大学
主分类号：	G06T7/00	分类号：	G06T7/00;G06T7/11;G06T7/90;G06T3/40;G06V10/82;G06V10/774;G06N3/0464;G06N3/084
代理公司：	北京同辉知识产权代理事务所(普通合伙) 11357	代理人：	江舟
地址：	730070 甘肃***	国省代码：	甘肃;62
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于卷积注意力模型皮肤病变分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于卷积注意力模型的皮肤病变分割方法，该分割方法具体按以下步骤：

步骤1：选取ISIC-2017数据集和PH2数据集：

ISIC-2017数据集包含8位RGB皮肤镜检查图像，图像大小从540×722-4499×6748像素不等，数据集提供2000张训练图像、用于验证的150张图像的单独数据集以及用于测试的600张图像的单独数据集，数据集中所有皮肤镜检查图像分别被标记为良性痣、黑色素瘤或脂溢性角化病，PH2数据集包含200张图像，其中160张图像为痣，分为普通痣和非典型性痣，其余40张图像为黑色素瘤，PH2数据集中的图像是大小固定为768×560像素的8位RGB图像，在相同条件下使用20倍放大倍数采集；

步骤2：数据预处理：

将ISIC-2017数据集中的2000张训练图像与150张测试图像合并，生成2150张皮肤镜检查图像的训练数据集，为了了解不同的色彩空间特征，在以RGB形式存在的2150张皮肤镜检查图像上增加色相饱和度值的三个通道，生成2150张HSV形式的皮肤镜检查图像，利用水平旋转、垂直旋转、水平垂直旋转这三种旋转方式随机生成样本，使得训练数据集拥有17200张皮肤镜图像，每个样例的右上为水平旋转、左下为垂直旋转、右下为水平垂直旋转，由于原始图像大小从540×722-4499×6748像素，按照原始图像的宽高比将图像的宽调整为256px，图像上下填充黑边，将高增加到256px，以此来组成训练图像；

步骤3：训练卷积神经网络模型：

建立网络模型，该网络模型是一个端到端的多标签深度网络，由多个注意力模块、多尺度输入层、U型卷积网络以及侧输出层组成：

注意力模块：网络模型利用卷积注意力模块提取图像特征，每个卷积注意力模块由固定模式的1×1、3×3、1×1卷积层、通道注意力模块和空间注意力模块依次堆叠；

在通道注意力模块中，利用特征通道间关系生成通道注意图，将输入特征F_C∈R^C×H×W，通过使用平均池化和最大池化操作来聚合特征图的空间信息，生成平均池化特征和最大池化特征，将生成的两个特征传送到由Fc1层、Relu激活函数和Fc2层组成的多层感知器中进行维度变换和矩阵乘积，获得两个通道的关联强度，分别输出特征图和然后对通道间的注意力特征图使用逐元素求和，使得各个通道之间能产生全局的关联，以进一步增强特征表示，合并输出的特征图X_C，如公式(1)所示，再经过sigmoid操作获得最终输出的通道注意力特征图A_C如等式(2)所示：

(1)式和(2)式中，表示逐元素相加；C表示通道个数；Xi,1,1表示坐标为(i,1,1)的元素；∪表示逐元素拼接；

在空间注意力模块中，将原始特征FS∈RC×H×W，沿通道轴使用平均池化和最大池化操作汇总特征图的通道信息，以生成两个二维特征图，再对特征进行加权融合，这样对于各个位置的点，其通过注意力图在全局空间中融合相似特征，之后利用卷积层生成2D空间注意图为：

(3)式中，W，b分别表示MLP的权重，MLP的偏置；Cat(.)表示拼接；Conv(.)表示卷积操作，其中C、H、W分别表示特征图的通道数、宽及高，里的W表示Weight，Xs∈R^1×H×W里的W表示width；

最后再经过sigmoid操作，获得最终输出的空间注意力特征图A_S为：

其中，m，n分别表示m^thposition和n^thposition；∪表示逐元素拼接；

其中编码器路径：利用注意力模块提取特征信息，使用步长为2的3×3卷积替代下采样中的池化操作，在每层的卷积操作后使用批量标准化层对每个层特征图进行归一化，然后使用带泄露整流激活函数将其激活，在编码器路径中，建立了多尺度输入层，利用注意力模块块提取特征信息，使用步长为2的3×3卷积替代下采样中的池化操作，将多尺度输入建立于图像进行下采样过程的编码路径中，给定输入尺寸为256×256的原始图像，经过三次下采样过程分别获得128×128、64×64和32×32三个不同尺寸的图像，与原始图像结合形成图像金字塔；

其中解码器路径：利用步长为2的3×3反卷积层、批量标准化层以及注意力模块输出解码器每层的特征图，提取每层注意力模块输出特征图，使用双线性插值法将其扩展到原输入图像大小，采用卷积操作完成多尺度特征融合输出对应层预测图，并将这些预测图相加后形成最终的预测图；

其中侧输出层：使用双线性插值法将输出特征图扩展到输入图像大小并采用步长为2的3×3卷积将每层多通道特征图转化为2通道特征图，实现降维操作，每层输出图像使用交叉熵损失函数来计算输出损失，对于样本(x,y)，x＝﹛x_i，i＝1，…，N﹜表示为训练数据，y＝﹛y_i，i＝1，…，N﹜为对应的标注数据，其中y_i＝﹛0,1﹜，第i个样本被预测为1的概率为y_p，N表示样本的总数，M表示多尺度输出层数，此时M＝5，每个多输出层的相应损失权重表示为a_i＝﹛a_i,i＝1，…，M﹜，并且a_i＝﹛0.1、0.1、0.1、0.1、0.6﹜，对于每个输出图像，分别计算损耗L，L定义为：

叠加每个输出层的L(N)，最终的输出损耗函数L为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北师范大学，未经西北师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010782877.6/1.html，转载请声明来源钻瓜专利网。

上一篇：使用相异训练源训练分类模型及应用其的推论引擎
下一篇：基于远程桌面的网络直播方法、直播系统及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于卷积注意力模型的皮肤病变分割方法有效

专利文献下载