[发明专利]一种基于CNN-XGBoost的胶质母细胞瘤预后预测方法在审
申请号: | 202111409937.0 | 申请日: | 2021-11-25 |
公开(公告)号: | CN114283938A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 郭畅宇;何敏;邱圆 | 申请(专利权)人: | 湖南大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cnn xgboost 胶质 细胞 预后 预测 方法 | ||
1.一种基于CNN-XGBoost胶质母细胞瘤预后预测方法,其特征在于,包括以下步骤:
S1:脑部MR影像基础预处理;
将获得的2D图像根据已有的分割标签对其掩膜提取感兴趣区域(ROI,region ofinteresting),而后进行标准化、归一化操作。
S2:基于混合双高斯模型的肿瘤特征图提取;
将胶质母细胞瘤的MR影像强度直方图使用双高斯拟合,聚集为2类,并选取2类的中间值作为最优阈值,然后使用该阈值将胶质母细胞瘤的MR影像分为由高强度子图与低强度子图组成的肿瘤特征图。
S3:数据增强
采取对输入的ROI掩膜图像、S2步骤中提到的高、低强度肿瘤特征图以及对应的分割标签图片同时进行在线数据增强的操作。具体包括有随机垂直翻转、随机水平翻转、随机旋转。
S4:深度学习特征提取
构建输入为S2步骤中提到的肿瘤特征图(包含由高、低强度子图)、对应ROI分割标签图像以及病人的临床信息(KPS评分值,年龄),其主干网络为Resnet18的2D深度卷积神经网络进行深度特征的提取;
S5:基于传统机器学XGBoost特征分类器进行预后模型的建立
将S4步骤中提取到的高维特征利用XGBoost进行拟合分类。
2.根据权利要求1所述的脑部MR影像基础预处理方法,其特征在于:
根据已有分割标签进行掩膜提取得到的感兴趣区域(ROI,region of interesting),进行归一化、标准化操作。其中归一化、标准化的公式分别如下所示:
式中xi表示由T2序列切片得到的2D图像的像素点值,max(xexcept_background),min(xexcept_background)分别表示该2D图像的ROI区域内像素的最大值与最小值。
其中xnorm为归一化后得到2D图像矩阵,μexcept_background为归一化后2D图像感兴趣区域的均值,σexcept_background为归一化后2D图像感兴趣区域的标准方差。
3.根据权利要求1所述的基于混合双高斯模型的肿瘤特征图提取,其特征在于,所述S2具体包括以下步骤:
在进行图像数据处理时,考虑脑部MR图像是由多种特征叠加形成的,混合双高斯分布是混合分布模型的一种。因此,通过拟合混合高斯分布模型可以将其中的特征分离出来并称之为肿瘤特征图,以便于后续模型学习。
f(x)=G1(x)+G2(x)+n
其中,
对胶质母细胞瘤患者术前MR影像进行步骤S1所述的操作后,假设其强度分布直方图服从双高斯分布。式中f(x)表示为强度直方图的双高斯拟合函数,G1(x),G2(x)为待提取的高低强度子图的分布函数,n为噪声。
将胶质母细胞瘤的MR影像强度直方图使用双高斯拟合,聚集为2类,并选取2类的中间值作为最优阈值,然后使用该阈值将胶质母细胞瘤的MR影像提取得到肿瘤特征图,包括高强度子图与低强度子图。
4.根据权利要求书所述的数据增强方法,其特征在于:所述S3中,所述的在线数据增强方法包括:随机垂直翻转、随机水平翻转、随机旋转。
5.根据权利要求书所述的深度学习特征提取方法,其特征在于,所述S4具体包括以下步骤:
深度学习特征提取网络的输入为S2步骤中提到的肿瘤特征图(包含由高、低强度子图)、对应ROI分割标签图像以及病人的临床信息(kps评分值,年龄),主干网络为Resnet的2D卷积神经网络进行深度特征的提取;
深度学习特征提取网络由两个并行支路的特征提取模块组成,上游支路为简易特征提取模块,其主要聚焦于提取分割标签图像的简单特征。下游支路为肿瘤特征图的深度特征提取网络,其主要聚焦于由预处理后得到的肿瘤特征图。其中简易特征提取模块为一个浅层的CNN网络,内包含堆叠的多个3×3卷积层和批量归一化层,在卷积神经网络的最后一层,使用全局池化层将深度学习特征压缩为一维向量,记为LROI。下游模块的深度特征提取模块,其主干网络为Resnet系列,考虑到医学数据小样本特点,为缓解过拟合问题选择带有ImageNet预训练权重的Resnet18网络作为下游之路的主干网络。其中考虑到输入肿瘤特征图图像为包含高、低强度的2通道图像,故这里将网络的第一层卷积的输入通道数设置为2。
在进行模型训练时,使用交叉熵损失函数对模型的预测性能进行度量,CE(xi)表示样本xi对应的交叉熵损失函数,如公式所示:
其中yi表示样本xi真实的患者预后情况,0代表患者出现了不良预后,1代表患者没有出现不良预后;yi表示模型预测的样本xi的预后情况,取值为0或1。
Lfusion=F(λ1LROI+λ2Lspatialmap)+(λ3Lkps+λ4Lage)
其中,F为一个全连接层进行特征降维,在降维之后与输入年龄、KPS评分值等信息进行特征融合,其中权值参数为λ1=1,λ2=1,λ3=0.8,λ4=0.8。最后使用Adagrad算法对公式所示的损失函数进行优化,直至模型收敛。
根据权利要求书所述的基于传统机器学XGBoost特征分类器进行预后模型的建立,其特征在于:使用S4步骤中设计的深度卷积神经网络去掉最后一层全连接层后得到的特征进行XGBoost的分类拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111409937.0/1.html,转载请声明来源钻瓜专利网。