[发明专利]面向多种CT肺部纹理识别的非监督保内容域适应方法有效
申请号: | 202010541959.1 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111739076B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 徐睿;叶昕辰;丛臻 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06T7/41 | 分类号: | G06T7/41;G06T7/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 多种 ct 肺部 纹理 识别 监督 内容 适应 方法 | ||
1.面向多种CT肺部纹理识别的非监督保内容域适应方法,其特征在于,包括下列步骤:
1)训练和测试数据准备:采集了两组不同种类的CT图像,并利用人工方式在这两组CT图像上标注典型肺部纹理区域;此后,随机指定一组图像为源域数据,另一组图像为目标域数据;源域上的CT图像和人工标注的肺部纹理区域,处理成带标签的CT小块,用于在源域上监督训练深层网络模型;目标域的数据,处理成带标签和不带标签的CT小块,其中不带标签的CT小块,用于非监督方式对预先训练深层网络模型进行微调,带标签的CT小块用于测试本发明所提技术方案的最终结果;
2)源域上识别网络的构建和监督训练:使用残差网络构建深层网络模型,其结构包括编码器和分类器两部分;编码器提取输入CT肺部纹理图像特征表示,分类器使用特征表示生成识别结果;使用源域中的带标签CT小块,采用监督方式训练该深层网络,使网络模型在源域的数据中达到良好的识别性能;
3)目标域上的深层模型微调:针对步骤2)中获得的源域深层网络模型,使用目标域的不带标签的CT小块,利用基于对抗学习机制的损失函数进行非监督域适应,同时利用内容一致性模块和内容一致性损失函数对目标域编码器进行保持内容的约束,再结合源域中的监督分类训练,再次利用源域中带标签的CT小块,共同对目标域的深层模型进行微调,最终使深层网络模型能在目标域保持良好的肺部纹理识别性能。
2.根据权利要求1所述的面向多种CT肺部纹理识别的非监督保内容域适应方法,其特征在于,步骤3)中的目标域上的深层模型微调,具体包括以下步骤:
3-1)为目标域数据构建一个与源域网络模型结构相同的深层网络,并使这两个网络的编码器和分类器共享同样的网络参数权重,以步骤(2)中在源域数据中训练得到的网络模型的参数权重为初始值,进行目标域上的网络模型微调;
3-2)使用对抗学习机制,构建判别器,通过优化对抗损失函数进行域适应,缩小源域和目标域编码器特征表示域偏差;判别器由卷积模块和全连接层组成,以源域和目标域编码器特征表示为输入,将源域编码器特征表示判定为源域结果,标签为1,将目标域编码器特征表示判定为目标域结果,标签为0;对抗损失函数公式如下:
式中,Ladv(·)表示对抗损失函数值,D表示判别器,f表示编码器,表示数学期望,xs表示单次批量中参与训练的源域CT图像数据矩阵,xt表示单次批量中参与训练的目标域CT图像数据矩阵,Xs表示源域CT图像矩阵集合,Xt表示目标域CT图像矩阵集合,log(·)表示对数运算;
3-3)使用内容一致性模块通过内容一致性损失函数约束目标域编码器特征表示及输入的目标域CT肺部纹理图像,保持目标域内容一致性;内容一致性模块包括卷积模块和残差模块,将目标域编码器特征表示重建为单通道图像,与输入目标域CT肺部纹理图像通过L1范数约束;内容一致性损失函数公式如下:
式中,Lcp(·)表示内容一致性损失函数值,f表示编码器,g表示内容一致性模块,表示数学期望,xt表示单次批量中参与训练的目标域CT图像数据矩阵,Xt表示目标域CT图像矩阵集合,‖·‖1表示L1范数;
3-4)使用目标域中不带标签的CT小块,并再次使用源域中带标签的CT小块,计算对抗损失函数、内容一致性损失函数和源域中的分类交叉熵损失函数的和,作为网络微调的整体损失函数,具体公式如下:
Ltotal(f,h,g,D)=Ladv(D,f)+λcpLcp(f,g)+λtaskLtask(f,h)
式中,Ltotal(·)表示非监督保内容域适应的整体损失函数值,f表示编码器,h表示分类器,g表示内容一致性模块,D表示判别器,Ladv表示对抗损失函数值,λcp表示内容一致性损失函数系数,Lcp为内容一致性损失函数值,λtask表示分类交叉熵损失函数系数,Ltask表示分类交叉熵损失函数值;分类交叉熵损失函数的计算公式如下:
式中,Ltask(·)表示交叉熵损失函数值,f表示编码器,h表示分类器,表示数学期望,xs表示单次批量中参与训练的源域CT图像数据矩阵,ys表示xs对应类别标签矩阵,Xs表示源域CT图像矩阵集合,Ys表示Xs对应类别标签矩阵集合,∑表示求和运算符,K表示分类类别数,log(·)表示对数运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010541959.1/1.html,转载请声明来源钻瓜专利网。