[发明专利]可自适应调节感受野大小的肺炎图片检定装置与方法在审
申请号: | 202010422064.6 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111724345A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 武昱忻;李锵;关欣 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 调节 感受 大小 肺炎 图片 检定 装置 方法 | ||
1.一种可自适应调节感受野大小的肺炎图片检定装置,其特征是,包括X光机和计算机,X光机拍摄的图片输入计算机,计算机包括特征提取网络处理模块、特征金字塔模块、分类子分支和回归子分支模块;ResNet50和ResNet101分别与选择性核卷积结合形成SK-ResNet50和SK-ResNet101作为特征提取网络,ResNet50是50层的残差网络,ResNet101是101层的残差网络;所提取的特征输入特征金字塔模块进行处理,特征金字塔输出特征图;分类子分支模块为全卷积神经网络FCN模块,连接在特征金字塔网络输出的每个特征图上,输出预测框的检测分数;回归子分支模块也是全卷积神经网络FCN模块,也连接在特征金字塔网络输出的每个特征图上,输出预测框的位置,预测框是预测出的肺炎病灶区域。
2.一种可自适应调节感受野大小的肺炎图片检定方法,其特征是,建立选择性核卷积视网膜网络SK-RetinaNet,该网络包括三个部分:SK-ResNet、特征金字塔网络和子分支;其中SK-ResNet是在残差网络ResNet基础上残差块里加入自适应调整感受野大小的SK单元作为特征提取网络;特征金字塔网络的作用是利用SK-ResNet每层输出的特征图由上至下构建多尺度特征图集合;子分支由分类子分支和回归子分支构成,分类子分支是一个全卷积神经网络FCN,连接在特征金字塔网络输出的每个特征图上,回归子分支也连接在特征金字塔网络输出的每个特征图上,分类子分支和回归子分支实现在多个尺度上的检测与定位任务。
3.如权利要求2所述的可自适应调节感受野大小的肺炎图片检定方法,其特征是,以SK-ResNet50为特征提取网络检测所得结果和以SK-ResNet101为特征提取网络检测所得结果融合,检测结果包括预测框的左上角坐标和右下角坐标,以及该预测框的检测分数,融合方法为分别检测完成后,以检测分数作为权重,调整两模型检测的结果框的左上角点坐标和右下角点坐标。
4.如权利要求2所述的可自适应调节感受野大小的肺炎图片检定方法,其特征是,具体步骤:
将以SK-ResNet50和SK-ResNet101分别为特征提取网络检测所得结果融合。检测结果包括预测框的左上角坐标和右下角坐标,以及该预测框的检测分数。融合方法为分别检测完成后,以检测分数作为权重,调整两模型检测的结果框的左上角点坐标和右下角点坐标,对于左上角点横坐标为例,融合方法如式(7)所示:
其中tlx为预测框左上角点横坐标,s1为以SK-ResNet50为特征提取网络时的检测分数,s2为以SK-ResNet101为特征提取网络时的检测分数,Tlx为融合后的左上角点横坐标;
右下角点横坐标为例,融合方法如式(8)所示:
其中trx1、s3分别为以SK-ResNet50为特征提取网络时预测框右下角点横坐标和检测分数,trx2、s4分别为以SK-ResNet101为特征提取网络时预测框右下角点横坐标和检测分数,Trx为融合后的右下角点横坐标。
5.如权利要求4所述的可自适应调节感受野大小的肺炎图片检定方法,其特征是,SK单元包含三个操作:切片,融合和选择:
首先是第一个操作:切片,X是维度为(H′×W′×C′)的特征图,由不同的卷积核扩展到两个分支,两个操作分别为并且卷积后带有BN批标准化和ReLU激活函数;
其次是第二个操作:融合,对得到的两个特征图进行像素相加:
然后进行全局平均池化:
s∈RC,得到一个一维的特征图,这个特征图具有全局的感受野,接着是使用一个全连接层进行一个非线性变换来降低维度:
式中,δ代表ReLU激活函数,β代表BN批标准化,W∈Rd×C,为了研究d对模型效率的影响,使用减小比率r去控制它的值:
其中L代表d的最小值;
最后是第三个操作:选择,首先对z进行一个进行一个softmax操作:
式中A,B∈RC×d,Ac∈R1×d是A的第c个通道的特征图,ac是a的第c个元素。两个分支中B是冗余矩阵,因为ac+bc=1。最终的特征图V由下式获得:
SK-RetinaNet中,切片操作中的不同大小的卷积核卷积得到的神经元的感受野不同,根据输入的目标大小不同自适应地调节感受野大小;另一方面,SK中的融合操作能够实现在不过多增加训练参数的情况下,根据不同通道的重要程度自动训练每个特征通道的权重,以达到更精确的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010422064.6/1.html,转载请声明来源钻瓜专利网。