[发明专利]一种基于互学习的半监督医学图像分割方法及其系统在审
申请号: | 202111601008.X | 申请日: | 2021-12-24 |
公开(公告)号: | CN114418954A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 王如心;李烨 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06N3/08 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 孟洁 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 监督 医学 图像 分割 方法 及其 系统 | ||
本发明涉及图像分割识别技术领域,具体涉及一种基于互学习的半监督医学图像分割方法及其系统,本发明方法基于互学习算法的技术思路,采用至少两个半监督学习模型进行对偶组合,构建基于互学习的深度半监督学习网络。通过网络中不同子网络(学生网络、教师网络)在训练过程中的交替互相监督,并迫使其输出的类别预测概率保持一致,有效的提高了对无标签样本图像的判断准确性,提高了对标记样本和无标签样本特征提取的鲁棒性。
技术领域
本发明涉及图像分割识别技术领域,具体而言,涉及一种基于互学习的半监督医学图像分割方法及其系统。
背景技术
在医疗领域,由于人工标注成本高和标签不可避免的模糊性,一定程度上限制了基于人工智能的辅助诊断模型获得更高的精度和更好的泛化能力。然而,为了获得更高的精度对大规模的训练数据进行注释是非常昂贵和耗时的,诸如医学影像数据集,虽然每天产生海量的影像数据,但由于标注本身的专业性以及不可避免的标注时间成本,其中可能只包含一小部分来自专家的标记数据,留下一大部分未标记。这部分未标记数据在监督学习的范式中不能被利用,但实际上这部分数据包含了大量可用的“未显性表达”的信息,结合标注信息,有效的挖掘这部分样本数据具有很高的临床应用价值。所以如何利用有限的标记数据和大量的未标记数据建立有效的模型是当前人工智能模型可泛化的关键挑战之一。
另一方面,在当今飞速发展的大数据时代,每天从不同领域都会产生大量的数据。通过这些不同类型/模态的数据,模型对同一事物的表征也变得更加具体、全面。在医疗领域,医生在诊断一个病人是否有某种疾病,可以汇总病人的各种医学影像数据,查看其医疗记录,或获得临床病理结果,通过综合这些信息得到一个更加精准的判断。但是当前基于人工智能的图像分割方法,大都通过对单一模态数据进行统计分析或机器学习来建模。实际上,仅依靠单种模态的数据难以发现图像中不同层次不同因素之间蕴含的协同语义信息。比如,在判断样本图像的区域和类别时,由于单模态的影像都只能特定的反映某些生理结构或者功能性的改变,判断准确率不能令人满意。而不同模态医学影像数据,如MRI,DT1,fMRI可从各自特定角度提供生理结构区域状态信息,为疾病的诊断提供辅助帮助。但数据的类型和标签属性差异较大,难以通过一个图像分割方法来判断。
现有的半监督学习允许模型在其监督学习中集成部分或者全部的无标签数据,通过这些大量无标记的数据最大化模型的学习性能,同时最小化标注数据的成本[1][2]。在半监督学习方法中,一般遵循一些假设的支撑[3]:平滑-低密度假设(SmoothnessLow-density assumption)和流形假设(Manifold assumption)。
平滑-低密度假设是指样本数据间的距离相互比较近时,则他们拥有相同的类别且决策边界应该尽量通过数据较为稀疏的地方,避免把稠密的样本分到决策边界的两侧。在这一假设的前提下,学习算法就可以利用大量未标记的样本数据来分析样本空间中样本分布情况,从而指导学习算法对分类边界进行调整,使其尽量通过样本数据布局比较稀疏的区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111601008.X/2.html,转载请声明来源钻瓜专利网。