[发明专利]一种融合注意力机制的三维卷积神经网络肺部结节图像自动检测方法在审
申请号: | 202010192413.X | 申请日: | 2020-03-18 |
公开(公告)号: | CN111415342A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 赵德群;金亚荣;李煜 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 注意力 机制 三维 卷积 神经网络 肺部 结节 图像 自动检测 方法 | ||
1.一种融合注意力机制的三维卷积神经网络肺部CT图像自动检测方法,其特征在于:该方法的实施过程如下,通过定裁和不定裁的方案对采集到的肺部CT图像进行裁剪,把剪裁得到的肺部CT图像送入到由3D注意力残差网络作为基础模块搭建的网络模型中,让网络模型自动提取肺部CT图像中的特征,并采用二分类交叉熵作为分类损失,用SmoothL1作为位置回归损失;
通过SGD优化器来指导网络不断训练,使得网络模型学习到参数,输出肺部结节在图像中的位置信息和概率预测;
通过检测方法输出的位置信息和概率预测值,找到肺部CT图像中的结节位置并标注出是结节的概率值,从而实现对肺部CT图像中的结节特征检测和预测。
2.根据权利要求1所述的一种融合注意力机制的三维卷积神经网络肺部CT图像自动检测方法,其特征在于:注意力模块搭建过程如下,
1)通道注意力机制
压缩立体特征图,分别采用全局最大池化和全局平均池化的方法压缩立体特征图,并将所得的特征图,按通道进行像素级的相加;
通过sigmoid激活函数将特征输出映射到(0,1)区间,得到对每个通道的关注度即通道权重;
将输入的立体特征图与通道权重相乘,从而加强对重点特征的关注;
2)空间注意力机制
在通道维度上,对输入的立体特征图,进行max和mean操作,得到两个立体特征图,并将所得到的两个立体特征图在通道维度上拼接;
通过卷积操作压缩通道,并用sigmoid激活函数,将特征输出映射到(0,1)区间,求得对每个像素的关注度即像素权重;将输入的立体特征图与像素权重相乘,从而实现对前景信息的加强;
3)注意力模块
输入的立体特征图,经过通道注意力,获得通道权重,对特征的选取功能,加强对有用特征的表达;
将获得的立体特征图,经过空间注意力,获取每个图像像素的权重,实现对有效像素信息的选取,削弱图像背景像素的影响;
将获得的立体特征图与原输入的立体特征图相加。
3.根据权利要求1所述的一种融合注意力机制的三维卷积神经网络肺部CT图像自动检测方法,其特征在于:注意力残差网络模块的搭建过程如下,
将残差机制和注意力模块相融合,使用残差机制来自动选择合适的网络深度,有效的避免网络的退化现象;并将Attention Block模块加入,对特征进行筛选,加强对有用特征的关注,增强网络的表达能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010192413.X/1.html,转载请声明来源钻瓜专利网。