[发明专利]一种融合多尺度特征和注意力机制的医学图像分割方法在审
申请号: | 202111458212.0 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114119638A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 彭敦陆;王萌萌 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T9/00;G06T3/40;G06T5/00;G06T5/50;G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 尺度 特征 注意力 机制 医学 图像 分割 方法 | ||
本发明提供一种融合多尺度特征和注意力机制的医学图像分割方法,首先基于U‑Net构建了包含编码器‑解码器、多尺度特征提取模块以及注意力模块的医学图像分割模型,该模型以待分割图像作为输入;然后将基于编码器得到的高级特征图和基于多尺度特征提取模块融合了多尺度信息的低级特征图输入至注意力模块得到整合了局部信息与全局信息关系的特征图;最后将特征图输入至解码器进行上采样处理以恢复图像分辨率,得到与对应的分割结果;该医学图像分割方法利用多尺度特征提取模块融合了图像的多尺度信息,同时采用注意力机制让医学图像分割模型关注相关性最强的一些信息,提高了该模型对长距离依赖关系的建模能力,从而提升医学图像的分割精度。
技术领域
本发明属于计算机视觉领域,具体涉及一种用于场景解析中对医学图像基于深度学习进行医学图像分割的方法。
背景技术
医学图像分割是计算机辅助诊断和制定治疗计划中的一项非常重要的工作,任务是对医学图像上的感兴趣区域实现像素级分割。早期的医学图像分割系统主要基于传统图像分割算法改进,如基于边缘检测的分割算法、基于阈值的分割算法和基于区域的分割算法。但是这类方法极大地依赖于医生的专业知识,而且泛化能力差,无法迁移到新的任务场景中。随着深度学习技术的发展,凭借着强大的建模能力,它已经逐渐成为医学图像分割的主流方法。相比传统的算法,基于卷积神经网络的深度学习算法在很多视觉识别任务中都取得了突破性进展,如图像分类、语义分割等,因此也被引入到医学图像分割中。
随着深度学习技术的发展,自然图像的分割算法逐渐被应用于医学领域。其中最具代表性的研究工作是全卷积神经网络。全卷积神经网络中,使用卷积层替换了全连接层,提高了网络对图像特征的提取能力。此外,为了提高分割的精确性,引入了跳跃连接,可以融合不同层次的特征。在不改变图像尺寸的情况下,对图像实现了像素级的分割,与传统方法相比实现了显著性提升。随着FCN的成功,研究人员开始关注如何针对医学图像的特点对分割模型进行改进,考虑到医学图像具有丰富的空间信息,而网络下采样过程容易损失空间信息,基于编码器-解码器的网络结构开始崭露头角。
在编码器-解码器网络中,编码器用一系列卷积层组成,高层特征提取到图像的语义信息,低层特征提取图像的细节信息,再使用解码器对特征图进行上采样,恢复图像分辨率,输出分割后的结果。尽管这类模型已经具有很强的特征提取能力,但是仍然存在一些不足:1)由于下采样操作的存在,必然会造成细节信息的损失,这对于目标边界处的分割或者是小目标的捕获将会是很大的挑战。尽管在解码器部分会通过上采样来恢复图像分辨率,但是下采样过程中损失的有价值的信息无法恢复;2)低层的特征图往往具有更多的细节信息,但并没有得到充分的利用。模型大多是对具有更多语义信息的高层特征图进行操作,对低层特征图关注不够。因此,需要有一种更加精确的分割方法来解决上述问题。
发明内容
为解决上述问题,提供一种融合多尺度特征提取和注意力机制的医学图像智能分割方法,本发明采用了如下技术方案:
本发明提供了一种融合多尺度特征和注意力机制的医学图像分割方法,其特征在于,包括以下步骤:步骤S1,将U-Net作为骨干网络,基于编码器-解码器结构构建医学图像分割模型,医学图像分割模型具有编码器、解码器、多尺度特征提取模块以及注意力模块;步骤S2,将待分割图像输入至医学图像分割模型,基于编码器对待分割图像进行编码得到特征图E;步骤S3,基于多尺度特征提取模块对待分割图像进行特征提取获取多种尺度信息的低级特征图M;步骤S4,将低级特征图M以及特征图E分别作为低级特征以及高级特征输入至注意力模块得到整合了局部信息与全局信息关系的特征图A;步骤S5,将特征图A输入至解码器进行上采样处理,获取与待分割图像对应的分割结果。
本发明提供的一种融合多尺度特征和注意力机制的医学图像分割方法,还可以具有这样的技术特征,其中,编码器-解码器结构包括4层编码层以及4层解码层,编码层由卷积层、池化层以及激活函数组成,编码层对待分割图像进行编码的过程表示为:
Ei=Sigmoid(Pooling(Conv(Input)))
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111458212.0/2.html,转载请声明来源钻瓜专利网。