[发明专利]基于Tiny-YOLOv3的肺炎图像目标检测方法在审
申请号: | 202110324430.9 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113034473A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 滕皓;陆慧娟 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 tiny yolov3 肺炎 图像 目标 检测 方法 | ||
1.一种基于Tiny-YOLOv3的肺炎图像目标检测方法,其特征在于:包括如下步骤:
1)将原始XML文件解析为TXT,对于该TXT文件的每一行,具体包括图像绝对路径,肺炎病灶左上角以及右下角坐标值,存在病灶的概率;
2)使用Tiny-YOLOv3对训练数据进行训练,所述Tiny-YOLOv3包括特征提取网络和预测网络,所述的特征提取网络以卷积操作为主,所述的预测网络包括不同分辨率大小特征网络(所述卷积操作已在深度学习代码框架Pytorch中被实现),
3)首先将肺炎图像图像分辨率调整为416×416×3,接着将其依次送入如下的卷积操作中:卷积核大小为3×3,步长为1,输出通道为16的卷积操作,卷积核大小为3×3,步长为2,空洞卷积率为2的空洞卷积操作,卷积核大小为3×3,步长为1,输出通道为32的卷积操作中,卷积核大小为3×3,步长为2,空洞卷积率为2的空洞卷积操作,卷积核大小为3×3,步长为1,输出通道为64的卷积操作,卷积核大小为3×3,步长为2,空洞卷积率为2的空洞卷积操作,卷积核大小为3×3,步长为1,输出通道为128的卷积操作,卷积核大小为3×3,步长为2,空洞卷积率为2的空洞卷积操作,卷积核大小为3×3,步长为1,输出通道为256的卷积操作中,得到26×26×256的特征图F1,
4)将得到的F1特征图依次送入如下的卷积操作中:卷积核大小为3×3,步长为2,空洞卷积率为2的空洞卷积操作,卷积核大小为3×3,步长为1,输出通道为512的卷积操作,卷积核大小为3×3,步长为1,输出通道为1024的卷积操作,卷积核大小为3×3,步长为1,输出通道为256的卷积操作,此时得到特征图F2,
5)将得到的F2特征图依次送入如下的卷积操作中:卷积核大小为3×3,步长为1,输出通道为512的卷积操作,卷积核大小为3×3,步长为1,输出通道为3*(5+C)的卷积操作,C代表类别的个数,最终得到可以进行预测的特征图13×13×3*(5+C),即为R1,
6)将得到的F2特征图依次送入如下的卷积操作中:卷积核大小为1×1,步长为1,输出通道为128的卷积操作,再进行一次上采样操作,得到特征图F3,其维度为26×26×128,
7)将得到的F1与F3进行Concat操作,并将结果特征图依次送入如下的卷积操作中:卷积核大小为3×3,步长为1,卷积核大小为1×1,步长为1,最终得到可预测的特征图R2,其维度为26×26×3*(5+C),
8)将R1与R2和真值计算损失函数,并反向传播训练参数,
步骤3)-步骤7)中,每次卷积操作后将输入Swish激活函数处理,通过所述Swish激活函数减少负输入的丢失,
卷积操作中卷积核为参数,自图像左上角至右下角遍历图像,对应元素相乘得到另一张图像,将该图像所得到的值作为Swish激活函数的输入,得到Swish激活函数的输出值即为特征图,将得到的预测结果与数据集的真实值输入到损失函数中,计算损失函数的值,该值为该模型的误差值,计算损失函数的微分值,对卷积核参数进行更新迭代,最终得到局部最优解,预测时,将图像输入模型,首先提取特征得到预测值,此时该预测值无需再次计算损失函数,表现为图像中的病灶的检测框,
本发明中,用采用Swish激活函数代替现有技术的Leaky ReLU激活函数,现有技术的Leaky ReLU激活函数公式如下:
Swish激活函数公式如下:
Swish=x*sigmoid(βx) (2)
在x<0处,Swish激活函数的曲率更为灵活,使得梯度不为0,从而使得输入为负值的神经元保持有效,
在图1中,输入图像为一张肺炎X光图像,原始图像大小为3×1024×1024,由于显存的限制,将其重设置大小为3×416×416,原始图像经过四次步长为2的空洞卷积后得到特征图F1,其大小为26×26×256,接着将F1经过一次步长为2的空洞卷积后得到第一个输出值R1,其维度为13×13×3*(5+C),将F2经过一次上采样得到F3,对F1和F3进行Concat操作得到第二个输出值R2,其维度为26×26×3*(5+C),以上涉及图像尺寸仅为例子,实际可以根据场合调整,
其损失函数为平方损失函数,公式如下所示:
应用一个对数函数来设置损失函数的权值:
ψ(t)=log(α|APi-APi-1|+e) (4)
在公式(4)中,α可以用于控制权重变化的快慢,α的取值范围为100~1000;APi为第i个epoch的平均精度值,e为自然底数,
实时计算每个epoch的平均精度并计算AP导向权重,植入AP导向权重的损失函数,其变体损失函数公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110324430.9/1.html,转载请声明来源钻瓜专利网。