[发明专利]一种基于深度多尺度注意力卷积神经网络的视网膜眼底血管分割方法有效
申请号: | 202010960954.2 | 申请日: | 2020-09-14 |
公开(公告)号: | CN112102283B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 李阳;张越 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/08;G06N3/04;G06V10/774;G06V10/82 |
代理公司: | 北京金恒联合知识产权代理事务所 11324 | 代理人: | 李强 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 尺度 注意力 卷积 神经网络 视网膜 眼底 血管 分割 方法 | ||
1.基于深度多尺度注意力卷积神经网络的视网膜眼底血管分割方法,其特征在于包括:
步骤1:获得国际公开的彩色视网膜眼底血管分割数据集;
步骤2:选取训练数据集中用于训练的图片,将其调整成为512×512像素尺寸,设计随机数据增强环节,建立训练数据集;
步骤3:选取测试数据集中用于测试的图片,将其调整成为512×512像素尺寸,建立测试数据集;
步骤4:使用Pytorch深度学习框架建立深度多尺度注意力卷积神经网络;
步骤5:将步骤2中所建立的训练数据集输入到步骤4中所建立的深度多尺度注意力卷积神经网络中,进行视网膜眼底血管分割模型的训练; 设置训练数据Batchsize为5,设置网络学习率为0.0005,采用Adam优化器进行网络参数优化,损失函数采用交叉熵损失函数,经过550次迭代训练后保存模型参数;
步骤6:加载步骤5中所保存的模型参数,得到训练好的视网膜眼底血管分割模型,将步骤3中建立的测试集输入到模型中,获得视网膜眼底血管分割结果,
其中:
所述步骤2中,由于原有数据集样本数过少,设置四个随机数据增强环节来扩充原本数据集,包括随机HSV增强环节、随机水平镜像环节、随机垂直镜像环节、随机旋转环节,经过随机数据增强环节,将原本数据集增大到任意规模,从而满足深度学习模型大量训练数据的要求,
在所述步骤4中:
沿用U-Net架构,包括一个编码器、一个解码器,
全局注意力模块与局部注意力模块被安插在编码器与解码器跳跃连接的通路上,
全局注意力模块与局部注意力模块并行连接,
每对全局注意力模块与局部注意力模块的整体的输出是该全局注意力模块与局部注意力模块各自的输出的叠加,
全局注意力模块有两个输入,一个是编码器部分第n层的输出,另一个是解码器第5-n层的输入,其中n=1,2,3,4,
局部注意力模块的输入为编码器部分第n层的输出,其中n=1,2,3,4,该局部注意力模块有四条并行的卷积通路,
多尺度特征融合模块从网络解码器的第一,二,三层分别引出三条卷积通路,其中:第一条通路的输入为网络解码器第一层的输出,整个通路包含三个上采样层和三个卷积层;第二条通路的输入为网络解码器第二层的输出,整个通路包含两个上采样层和两个卷积层;第三条通路的输入为网络解码器第三层的输出,整个通路包含一个上采样层和一个卷积层;在三条卷积通路都构建完后,将三条卷积通路的输出与整个解码器的输出相叠加,再经过一个1×1的卷积核,得到整个多尺度特征融合模块的输出。
2.如权利要求1所述的基于深度多尺度注意力卷积神经网络的视网膜眼底血管分割方法,其特征在于:
训练图像以及训练图像的分割标签按被按照相同的标准调整为512×512像素尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010960954.2/1.html,转载请声明来源钻瓜专利网。