[发明专利]一种基于模糊逻辑的医学图像深度分割方法在审
申请号: | 202310195481.5 | 申请日: | 2023-03-02 |
公开(公告)号: | CN116188435A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 丁卫平;王海鹏;刘传升;陈悦鹏;尹涛;耿宇;鞠恒荣;黄嘉爽;高自强;薛皓文 | 申请(专利权)人: | 南通大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V40/18;G06V10/26;G06V10/44;G06V10/80;G06V10/82;G06N3/045 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226000 江苏省南通市崇*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 逻辑 医学 图像 深度 分割 方法 | ||
1.一种基于模糊逻辑的医学图像深度分割方法,其特征在于,包括以下步骤:
S1:对眼底医学图像数据集进行扩充,数据集中包含N对彩色原图和眼底血管分割图,将每张图片以中心点顺时针旋转,每10°保存新的图片,扩充到36*N对原图和对应分割掩码;
S2:使用CNN和Transformer模型分别提取眼底图像特征,CNN模型逐渐增加感受野并将特征从局部编码到全局,Transformer模型从全局自注意力开始,最后恢复局部细节,利用不同深度学习模型,将两个模型在三个不同尺度的特征图保存下来,进行后续融合;
S3:设计模糊融合模块将两个分支提取的相同尺度特征进行结合,模糊融合模块中结合注意力机制和模糊测度与模糊积分,对CNN特征和Transformer特征分别使用空间注意力和通道注意力来增强特征表示,对最低尺度特征计算模糊测度并使用Choquet模糊积分消除特征中的异质性和不确定性;
S4:构造模糊注意力融合模块逐步上采样与融合不同尺度特征图,处理分割边界的不确定性,将融合的特征图恢复到输入大小,生成最终分割图像;
S5:搭建基于模糊逻辑的深度学习网络FTransCNN,用扩充后的图像数据对模型进行训练,准确分割出眼底血管以及末梢图像。
2.根据权利要求1所述的基于模糊逻辑的医学图像深度分割方法,其特征在于,所述步骤S2的具体步骤如下:
步骤S2.1:针对CNN模型,将大小为x∈RH×W×C的图像输入到由ResNet50组成的CNN特征提取网络中,其中H、W、C分别表示输入图像的高度、宽度和通道数,实现图像数据从高分辨率图像到低分辨率图像的转化,构建有五个模块的ResNet模型,每个模块将特征图下采样两倍,将第4个块输出第3个块输出和第2个块输出的特征图保存下来,与Transformer模型相应大小的特征图进行后续融合;
步骤S2.2:针对Transformer模型,首先将图像划分为块,其中,S设置为16,其次将这些Patch块展平并拼接,用全连接层对拼接的向量降维,接着对输入图像特征加入位置编码得到输入特征x,然后将预处理特征x输入到Transformer的编码器进行特征提取,最后将提取的特征进行上采样,得到与CNN模型提取特征尺度相同的特征,Transformer特征提取过程如下:
headi=Attention(XiWiQ,XiWiK,XiWiV) (2)
MSA(Q,K,V)=Concat(head1,…,headi)W0 (3)
MLP(X)=max(0,XW1+b1)W2+b2 (4)
其中,Q,K,V为将输入X经过线性变换后得到的矩阵,Q表示要查询的信息,K表示被查询的向量,V表示查询得到的值,dk表示查询矩阵或者键值矩阵的维度,softmax是激活函数,WiQ、WiK、WiV分别表示第i个自注意力的线性变换矩阵,经过学习得到,Concat表示拼接操作,W0表示线性变换矩阵,max为求最大值操作,W1、W2为权重,b1、b2是常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310195481.5/1.html,转载请声明来源钻瓜专利网。