[发明专利]一种基于深度学习的CT图肺结节检测方法有效
申请号: | 201810287479.X | 申请日: | 2018-03-30 |
公开(公告)号: | CN108537784B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张雪;朱安婕;郑德生;臧宇航;吉普照 | 申请(专利权)人: | 四川元匠科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/10 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 徐丰;张巨箭 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 ct 结节 检测 方法 | ||
1.一种基于深度学习的CT图肺结节检测方法,其特征在于:包括以下步骤:
S01:获得肺部CT图像,并转换为DICOM格式的图像;
S02:获取转换为DICOM格式的图像的格式数据中的病人信息及CT图的长和宽及图片像素之间的间隔;同时对图像的CT值进行归一化预处理,并对一定范围以外的图像CT值都统一为端点值;所述的对图像的CT值进行归一化预处理,并对一定范围以外的图像CT值都统一为端点值包括:对图像进行归一化,将图像CT值的范围从[-1000,400]归一化为[0,1];同时400以上的CT值都统一成400,使每一个像素都可以平等权重;
S03:对步骤S02预处理完成的CT图像进行肺容积分割,只保留肺部的图像;步骤S03中所述的肺容积分割包括:
(1)根据图形学对图像中的像素进行标注,使相邻的在同一区域的像素有相同的标记;在标注的过程中由于实际影像没有严格的区域划分,导致存在一些很小的区域,参考周围区域的标记将小区域融合进其他的面积较大的区域;
(2)保留左右肺叶,对外部的区域阈值填充:分别以阈值3和4产生两个掩膜,然后处理这两个掩膜,具体过程为:计算掩膜中的每个点的值的和,如果和大于零对掩膜进行形态学处理计算其凸包;接着如果凸包中的值之和大于1.5倍的原来掩膜中的值的和,就用形态学处理过后的掩膜替换掉原来的掩膜,否则认为这个掩膜刚好盖住肺部所述掩膜不变;对于掩膜之外的区域,即肺部外的区域用170的阈值进行填充,掩膜内不属于肺部的区域也使用170的阈值进行填充;
(3)进行数据重采样,先获得DICOM格式数据的坐标中心、像素间距,再通过插值把图像的分辨率统一起来,即将原始图像转换为1mm*1mm*1mm的分辨率;在转换分辨率的时候使用最临近插值法;
(4)按uint8类型、灰度图重新保存图片;
(5)将CT图从世界坐标转换成体素坐标,保存原来的坐标信息;进行世界坐标转化的同时,还需要根据肺部区域,将用于训练神经网络的标注数据也转换成体素坐标;其中,转换坐标的时候使用了开始读取的间距和坐标原点的信息;
S04:对图像进行候选结节检测,使用U-net卷积神经网络,找到候选结节的位置,输出一张带有候选结节位置标记的二维图像;
S05:在获取到候选结节之后,将候选结节送入消除假阳性的分类器进行二次检测;
其中步骤S04包括以下子步骤:
S041:输入一组大小为128*128、有32层的肺容积分割完成的图像;
S042:进行卷积核为2*2的最大池化,将原始图像转换成特征图大小为64*64,数量为32层的图像;
S043:再进行2*2的最大池化,将64*64*32的图像转换成特征图大小为32*32、数量为32层的图像;同时又为了增加特征图的数量,此处使用了两种不同的卷积核,最终特征图的数量变为32*2=64,即得到了特征图大小为32*32,数量为64的图像;
S044:再进行2*2的最大池化,将32*32*64的图像转换成特征图大小为16*16,数量为64层的图像;
S045:再进行2*2的最大池化,将16*16*64的图像转换成特征图大小为8*8,数量为64层的图像;
S046:进行2*2的反卷积,将8*8*64的图像转换成特征图大小为16*16,数量为64层的图像;
S047:进行2*2的反卷积,将16*16*64的图像转换成特征图大小为32*32,数量为64的层;
S048:为了增加特征图的数量便于检测肺结节,将步骤S047与步骤S043中得到的层拼接起来,得到特征图大小为32*32,数量为64+64=128层的图像;最终输出四维数据(p,z,y,x),其中p为是肺结节的概率,zyx是结节中心的三维坐标;
S049:将坐标映射回原图,用肉眼查看是否正确;
步骤S05包括以下子步骤:
S051:输入多组大小为60*40、有7层的原始图像,并依次执行步骤S052~S058的步骤;
S052:每张图像提取rgb3个通道信息,其中三个通道的信息可以直接对每层分别操作获取,得到特征图的大小为60*40、数量为21的图像;
S053:对3个通道的图像分别使用大小为7*7*3的3D卷积核进行卷积操作,同时此处为了增加特征图的数量,采用了两种不同的3D卷积核,最终得到特征图的大小为54*34,数量为15*2的图像;7*7表示空间维度,3表示时间维度,也就是说每次操作3层图像;
其中,得到特征图的大小为54*34的原因是:60*40的原始图像经过7*7的卷积操作,((60-7)+1)*((40-7)+1)=54*34,得到了54*34的图像;而特征图的数量为15*2的原因是:原始数量为21,每次操作3帧图像,且为了增加特征图的数量用了两种不同的3D卷积核,(((7-3)+1)*3)*2=15*2,所以得到数量为15*2的图像;
S054:再对图像使用大小为2*2的降采样操作,降低空间分辨率,降采样之后的特征图数量不变为15*2,图像大小变为(54/2)*(34/2)=27*17;
S055:再对图像分别使用大小为7*6*3的3D卷积核进行卷积操作,得到特征图的大小为21*12、数量为9*6的图像;同样为了增加特征图的数量,采用了三种不同的卷积核分别对两组特征图进行卷积操作;
其中,得到特征图的大小为21*12的原因是:27*17的图像经过7*6的卷积操作,((27-7)+1)*((17-6)+1)=21*12;
而在步骤S053中可知,r通道特征图数量=g通道特征图数量=b通道特征图数量=(7-3)+1)=5;因此此时对一组图像进行7*6*3卷积操作,每次操作3层图像,(5-3)+1=3,则特征图数量为3*3=9,而一共有2*3=6组,则此时的特征图数量为9*6;
S056:再对图像使用大小为3*3的最大池化降采样操作,降采样之后得到特征图的大小为(21/3)*(12/3)=7*4,数量为9*6的图像;
S057:在此阶段,r、g、b通道数量为3,仅在该层的空间维度上执行卷积操作,再对图像使用卷积核大小为7*4的卷积操作得到特征图的大小为1*1、数量为128的图像,其中128为经验值;
S058:最后进行全连接操作,得到3个通道所有的信息,组合起来得到最终的特征描述,将这些特征值拿去训练得到一个模型;
S059:将步骤S04中得到的候选结节输入该模型,进行二次检测,来输出判断识别的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川元匠科技有限公司,未经四川元匠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810287479.X/1.html,转载请声明来源钻瓜专利网。