[发明专利]一种基于YOLOv4-CA-CBAM-K-means++-SIOU的肺结节检测方法在审
申请号: | 202310251319.0 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116091490A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 李阳;陈茂龙;李亚洲;李春璇;闫波波;黄小雨 | 申请(专利权)人: | 长春工业大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06V10/26;G06V10/40;G06V10/762;G06V10/774;G06V10/80;G06V10/82 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov4 ca cbam means siou 结节 检测 方法 | ||
1.一种基于YOLOv4-CA-CBAM-K-means++-SIOU的肺结节检测方法,其特征在于,包括以下步骤:
S1:数据集的获取:获取肺部CT图像的数据集,本发明的实验采用公开数据集LIDC-IDRI数据集的子集LUNA16;
S2:数据集的处理:在肺结节检测中,肺结节只存在于肺实质内部并不需要肺实质以外的部分,故进行肺实质分割,然后将数据集处理为VOC格式的数据集以供YOLOv4检测框架读取。最后将LUNA16数据集中的1186张图像随机打散,并按照训练集:测试集:验证集为进行划分;
S3: CSPDarknet53特征提取网络提取原始图像特征:将原始图像输入到YOLOv4中,经过CSPDarknet53骨干网络提取图像的有效特征;
S4:YOLOv4检测框架中结合CA注意力机制:在YOLOv4检测框架的CSPDarknet53-Conv3后引入CA注意力机制,加强骨干网络的特征提取能力,捕捉捕捉肺结节的位置信息;
S5:颈部网络进行加强特征提取与特征融合。在颈部网络中使用SPP通过在不同尺度上执行池化操作,增加了感受野,可以生成固定大小的特征图,并且可以处理不同大小的输入图像,从而避免了目标检测中的尺度问题,从而更好地捕捉目标的上下文信息。以及使用PANet将来自骨干网络的不同尺度的特征图进行特征融合,从而增强检测模型的表征能力和检测精度;
S6:YOLOv4检测框架中结合CBAM注意力机制:在YOLOv4检测框架中CSPDarknet53骨干网络输出的三个有效特征层后及颈部加强特征提取网络中上采样和下采样后加入CBAM注意力机制,减少上采样及下采样肺结节特征信息丢失,捕捉肺结节的特征信息,加强网络特征提取能力;
S7:运用K-means++聚类算法进行锚框优化:在肺结节检测过程中,由于LUNA16数据集类别单一、目标较小,故在LUNA16训练集上采用K-means++聚类算法进行锚框优化,使用三个聚类中心替换原来的九个聚类中心生成更适合LUNA16数据集肺结节检测的锚点框;
S8:损失函数的优化:在YOLOv4中引入新的边界框回归损失函数SIoU损失函数替换原来的CIoU损失函数,提高训练的收敛速度和推理的准确性;
S9: 肺结节检测:在YOLOv4中头部检测网络中,有三个不同尺度的检测头,分别用于检测小、中、大尺度的目标,这些检测头的作用是对预测结果进行筛选和调整以及生成目标检测的输出结果,包括预测框的坐标和类别概率,从而完成目标检测的任务。
2.根据权利要求1所述的一种基于YOLOv4-CA-CBAM-K-means++-SIOU的肺结节检测方法,其特征在于,所述步骤S4的具体过程如下:
S1)为了使注意力模块能够捕捉具有精确位置信息的远程空间交互,我们将全局池化操作分解为一对特征编码操作,全局池化表达式如下:
其中,和是特征图的高和宽,为输入特征向量;
S2) 给定输入 ,首先使用尺寸为或 的池化核分别沿着水平坐标和垂直坐标对每个通道进行编码;
S3) 得到高度为 的第个通道的输出表达式如下:
其中,是特征图的宽,为输入特征向量;
S4) 宽度为的第个通道的输出表达式如下:
其中,是特征图的宽,为输入特征向量;
S5) 上述两种变换分别沿两个空间方向聚合特征,得到一对方向感知的特征图,对其进行连接操作,再采用卷积将其通道数以收缩率从压缩至,并使用ReLU函数进行非线性激活,表达式如下:
式中,是在水平方向和垂直方向对空间信息进行编码的中间特征图,是ReLU激活函数,是卷积变换函数;
S6) 将获取到的结果沿着空间维数分解为的张量和的张量,之后,再使用的卷积将通道数从升至,并使用sigmoid函数进行非线性激活,表达式如下:
式中,是sigmoid激活函数,,,和是卷积变换分别用于转换和为与输入一样通道的张量,与分别表示两个坐标轴上的注意力特征图,与分别展开用作注意权重;
S7)CA注意力机制的最终输出表达式如下:
式中,和分别表示输入特征和输出特征的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工业大学,未经长春工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310251319.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安防格栏触碰报警设备及其使用方法
- 下一篇:一种减薄设备