[发明专利]一种结合多尺度注意力的深层网络肺部纹理识别方法在审
申请号: | 202010541939.4 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111739075A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 徐睿;叶昕辰;丛臻 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06T7/41 | 分类号: | G06T7/41;G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 尺度 注意力 深层 网络 肺部 纹理 识别 方法 | ||
1.一种结合多尺度注意力的深层网络肺部纹理识别方法,其特征在于,包括下列步骤:
1)初始数据准备:初始数据包括用于训练和测试的肺部纹理CT图像块和对应类别标签;
2)识别网络构建:使用卷积和残差模块构建基础网络,使用多尺度特征融合模块学习肺部纹理的多尺度特征信息,使用注意力机制模块自动筛选特征图,最终提升识别精度;
3)识别网络训练:基于步骤(2)得到的识别网络进行训练;
4)利用测试数据评估网络的性能。
2.根据权利要求1所述的一种结合多尺度注意力的深层网络肺部纹理识别方法,其特征在于,步骤2)中构建的识别网络的结构,具体包括以下步骤:
2-1)识别网络由基础网络、注意力机制模块和多尺度特征融合模块构成;基础网络从不同尺度下从输入CT肺部纹理图像块学习特征信息;每个尺度学习的特征信息通过注意力机制模块自动筛选对识别任务有益的特征信息,同时自动抑制与识别任务关系较弱的特征信息;不同尺度学习的特征信息最终通过多尺度特征融合模块进行融合,并给出识别结果;
2-2)网络包含若干卷积模块,每个卷积模块由深层神经网络的通用单元,即卷积层、批标准化层和整流线性单元层组成;卷积模块通过跳跃连接相连共构成若干残差模块,通过引入残差学习机制,提升特征学习效率;
2-3)网络包含若干注意力机制模块,用于从卷积模块或残差模块学习的特征信息中自动筛选出对识别任务有益的特征信息,同时自动抑制与识别任务关系较弱的特征信息;
2-4)网络在不同尺度学习的特征信息通过多尺度特征融合模块进行有效融合,并给出识别结果。
3.根据权利要求1所述的一种结合多尺度注意力的深层网络肺部纹理识别方法,其特征在于,步骤2)中构建的识别网络的结构,具体包括以下步骤:
2-1)识别网络由基础网络、注意力机制模块和多尺度特征融合模块构成;基础网络由9个卷积模块构成,在三个不同尺度下从输入CT肺部纹理图像块学习特征信息;每个尺度学习的特征信息通过注意力机制模块自动筛选对识别任务有益的特征信息,同时自动抑制与识别任务关系较弱的特征信息;三个尺度学习的特征信息最终通过多尺度特征融合模块进行融合,并给出识别结果;
2-2)每个卷积模块由深层神经网络的通用单元,即卷积层、批标准化层和整流线性单元层组成;所有卷积层卷积核设置为3;第1-3个卷积模块卷积通道数设置为128,第4-7个卷积模块卷积通道数设置为256,第8-9个卷积模块卷积通道数设置为512;
2-3)除第1个卷积模块外,其余8个卷积模块每两个模块为一组通过跳跃连接相连共构成4个残差模块;对于一个残差模块,其输入通过内部卷积模块学习新的特征信息,跳跃连接将残差模块的输入与内部第二个卷积模块学习的特征图相连,构成残差学习机制;当残差模块的输入和内部第二个卷积模块输出数据矩阵大小相同时,跳跃连接为恒等映射,即将两者直接相加;否则,跳跃连接为卷积层,卷积核大小设置为1,卷积步长设置为2,调整残差模块的输入特征图,使其与内部第二个卷积模块输出数据矩阵大小相同;
2-4)4个残差模块按照1:2:1的比例,在三个不同的尺度下从输入CT肺部纹理图像块中学习多尺度特征信息;第二个和第三个尺度中的第一个残差模块的第一个卷积模块的卷积层卷积步长设置为2,实现对输入特征图的2倍降采样处理,降低输入特征图分辨率,扩大卷积模块局部感受野以增大尺度;其余卷积层卷积步长均设置为1,保持输入特征图与输出特征图分辨率一致以保持尺度;
2-5)网络起始的卷积模块及3个尺度中最后1个残差模块后均连接1个注意力机制模块,用于从卷积模块或残差模块学习的特征信息中自动筛选出对识别任务有益的特征信息,同时自动抑制与识别任务关系较弱的特征信息;输入特征图首先通过全局平均池化层以通道为单位计算特征图平均值,得到的向量连接2个全连接层,其中第1个全连接层神经元数为输入向量元素数的0.5倍,第2个全连接层神经元数与输入向量元素数相同,随后通过Sigmoid激活函数得到激活向量;该激活向量与输入特征图按通道对应相乘得到加权特征图,加权特征图随后与输入特征图相加构成残差学习机制,提升注意力机制模块学习效率,结果作为注意力机制模块的输出;
2-6)多尺度特征融合模块用于融合三个尺度学习的特征信息,并给出识别结果;该模块包含3条支路,以对应尺度学习的特征信息为输入,通过GAP层以通道为单位计算特征图平均值,随后连接1个包含7个神经元的全连接层,三条支路全连接层生成的向量对应相加并通过Softmax激活函数得到识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010541939.4/1.html,转载请声明来源钻瓜专利网。