[发明专利]基于多粒度卷积降噪自动编码器技术的医疗图像分类方法有效
申请号: | 201811181783.2 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109389171B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 杨云;曹丽娟;杨珀 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/36;G06N3/04 |
代理公司: | 昆明金科智诚知识产权代理事务所(普通合伙) 53216 | 代理人: | 胡亚兰 |
地址: | 650091 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多粒度卷积降噪自动编码器技术的医疗图像分类方法,通过在传统自动编码器的基础上,引入卷积神经网络;同时在同一个卷积层设置不同大小的卷积核,并在训练阶段加入随机高斯噪声,最后基于贪婪逐层训练方法训练成三个多粒度卷积降噪自动编码器的深度神经网络,经微调后最终实现参数全局最优。本发明实现了提高分类精度,达到最优分类结果并且对于复杂环境具有较强抗干扰能力,解决了现有技术中存在的数据类标获得困难且耗费资源多、提取特征单一和对复杂环境的抗干扰能力低导致泛化性显著下降的问题。 | ||
搜索关键词: | 基于 粒度 卷积 自动 编码器 技术 医疗 图像 分类 方法 | ||
【主权项】:
1.一种基于多粒度卷积降噪自动编码器技术的医疗图像分类方法,其特征在于,包括以下步骤:步骤1),医疗图像预处理:调用OpenCV工具包,将医疗图像的尺寸大小调整为256×256,调整后的图像进行归一化处理,并作为图像数据集,按照8:2的医疗图像张数比例将所述图像数据集划分为医疗图像训练集和医疗图像测试集;步骤2),建立医疗图像分类模型:a.运用多粒度卷积降噪自动编码器编码部分的网络结构对单张医疗图像进行编码操作;所述多粒度卷积降噪自动编码器编码部分同时采用1×1、3×3、5×5三种尺寸的卷积核,将步骤1)中经过预处理后尺寸为256×256的单张医疗图像即对应维度为65536的输入向量xi加入高斯噪声,得到被损坏医疗图像数据特征,所述被损坏医疗图像数据特征定义为干扰输入向量再通过线性映射进入非线性的激活函数得到中间层的特征表示向量αi:其中,αi为干扰输入向量经过两个隐藏层抽象后得到的中间层特征表示向量,角标i为医疗图像训练集中图像的维度;xi为输入向量;为原始干净的输入向量在加入噪声干扰之后得到的被损坏的干扰输入向量,即干扰输入向量;W1为多粒度卷积降噪自动编码器的输入层到中间层的权值矩阵,b1为自动编码器的输入层到中间层的偏置向量;表示的函数为编码函数,表示的函数为神经元的激活函数,取sigmoid函数或者恒等函数ReLu;b.基于多粒度卷积降噪自动编码器的解码部分与编码部分的网络结构完全对称,运用自动编码器解码部分的网络结构进行解码操作,对中间层的高级特征即干扰输入向量进行解码操作,经过隐藏层的中间特征向量αi通过线性映射进入非线性的激活函数,输出被损坏医疗图像的重构图像,所述被损坏医疗图像的重构图像对应重构后的输出向量zi:zi=g(αi)=l(W2αi+b2); (2)其中,zi为重构后的输出向量,即干扰输入向量的一个重构;g(αi)为解码函数,W2为自动编码器中间层到输出层的权值矩阵,b2是自动编码器中间层到输出层的偏置向量;l(W2αi+b2)表示的函数为神经元的激活函数;c.建立代价函数,衡量自动编码器的重构性能:基于前述步骤a和b,建立以干扰输入向量与输出向量zi之间的重构误差为变量的代价函数,通过将代价函数最小化,使干扰输入向量与重构后的输出向量zi相似;代价函数L(X,Z)如下所示,代价函数的损失值L越小,编码器部分特征提取越准确;其中,X代表输入的医疗图像训练集,Z表示输出的重构医疗图像数据;d.将公式(3)针对医疗图像训练集中的所有医疗图像进行损失值的求和计算,并引入正则化约束,得到多粒度卷积降噪自动编码器在医疗图像训练集上的总体代价函数J(W,b)如下:其中,J为整个医疗图像训练集中图像的损失值,W和b分别为整个多粒度卷积降噪自动编码器网络的权值矩阵和偏置向量,为正则化项,λ为惩罚因子,M为医疗图像训练集中图像的数量;e.基于贪婪逐层预训练的方法将前述步骤a至d重复三遍,得到三个多粒度卷积降噪自动编码器堆叠成的深度神经网络,即构成由三个多粒度卷积降噪自动编码器叠加而成的深度神经网络;f.解除深度多粒度卷积降噪自动编码器的解码器部分,在剩余的深度神经网络后接上softmax分类器,对深度多粒度卷积自动编码器的编码器部分提取到的医疗图像高级特征进行分类,softmax分类器的函数表达式如下:其中,wi是输入向量xi的权值向量,M为医疗图像训练集图像的数量,k为不同图像数据集的类别数;为评分函数,表示医疗图像反应的特征与某一疾病类别的相近程度,故f(x)函数称为归一化概率,表示预测医疗图像确认为某一疾病类别的概率;e为指数函数的数字常数;g.微调,使深度神经网络的参数W1、W2、b1、b2达到最优值;步骤3),将医疗图像测试集中的图像输入步骤2)建立的医疗图像分类模型中,通过测试集上的分类精度判断医疗图像归属的疾病类别,分类精度越高,医疗图像归属的该疾病类别的准确性越高,即达到精准分类的目的;分类精度的表达公式为:其中,f为基于多粒度卷积降噪自动编码器的医疗图像分类方法,D为医疗图像测试集,N为医疗图像测试集中图像的数量,xi为医疗图像测试集D中的第i张图像,yi为医疗图像测试集D中第i张图像的真实类标,f(xi)为基于多粒度卷积降噪自动编码器的医疗图像分类方法对医疗图像进行特征学习后的预测类标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811181783.2/,转载请声明来源钻瓜专利网。