[发明专利]一种通过协同主动学习模型的乳腺癌数据标注方法有效
申请号: | 201911266873.6 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111128373B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 顾力栩;杨智凯;赵愉;马愈祥;张宏 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06T7/00;G06N3/0464;G06N3/08 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 协同 主动 学习 模型 乳腺癌 数据 标注 方法 | ||
本发明公开了一种通过协同主动学习模型的乳腺癌数据标注方法,涉及医学影像数据标注领域,采用了深度学习网络、主动学习系统和协同学习系统相结合,对所述乳腺癌数据进行标注。本发明提出的方法同时将深度学习,主动学习与协同学习这三种原本完全不相干的机器学习分支结合到一起,并将其用于医学图像分类任务:乳腺图像计算机辅助诊断。具有不需要增加额外标注成本的前提下,能够充分利用全部样本,因此特别适合被用于“获取成本高”的医学图像分类任务,并且能获得比主动学习方法更好的模型预测效果。
技术领域
本发明涉及医学影像数据标注领域,尤其涉及一种通过协同主动学习模型的乳腺癌数据标注方法。
背景技术
乳腺癌是导致女性病亡的主要原因之一。据美国癌症学会估计,2018年乳腺癌新发病例数210万,占2018年全球总癌症新发病例数的11.6%,2018年全球约有63万人死于乳腺癌。全球女性乳腺癌的发病率逐年增。对于女性而言,包括中国在内的154个国家中,乳腺癌疾病发病率均居首位。目前,对乳腺癌病理图像辅助诊断的研究主要有手工提取特征的传统图像处理和基于深度学习的图像处理两种方法。
主动学习是一种利用较少标注样本就可以得到一个相对性能比较好的训练模型的算法,通过对未标注样本进行选择,筛选出部分高价值的样本进行标注,就可以实现少量样本标注量的情况下进行样本标注。而协同学习是当下较流行的一种半监督学习方法,最早是由Blum与Mitchell在1998年发表的文献Combining labeled and unlabeled datawith co-training中提出,目前被广泛应用于众多双度量。协同学习的核心理念即是首先根据两个不同的特征角度在少量标注集中构建出两个互相独立,且差异较大的分类器,然后利用这两个分类器分别对未标注样本集中置信度较高的样本进行预测,而预测结果就被视作为这些样本的“计算机标签”。接着只需要将这些新标注好的样本加入到当前已标注样本集,并重复上述过程,直至未标注样本集耗尽,即可得到一个理论上性能良好,同时真实标注成本极小的预测模型。协同学习目前被广泛应用于文本识别,车辆检测与生物识别,而对于本发明的主题医学图像分类任务,相关研究就相对较少。
因此,本领域的技术人员致力于开发一种通过协同学习和主动学习模型结合的乳腺癌数据标注方法,实现少量标注的同时提高深度学习模型的模型效果。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何通过主动学习与协同学习所结合,并且能够应用于深度学习的数据标注方式,来提高在乳腺癌数据的标注效率。
为实现上述目的,本发明提供了一种通过协同主动学习模型的乳腺癌数据标注方法,其特征在于,采用了深度学习网络、主动学习系统和协同学习系统相结合,对所述乳腺癌数据进行标注。
步骤1、建立未标注样本集U,用于存储各未标注样本的标注信息与标注方式;
步骤2、通过所述主动学习系统,在所述未标注样本集U中逐一取出最有价值的样本进行人工标注,并将标注好的样本加入到已标注样本集A,该过程将持续迭代到启动自学习功能或是所述未标注样本集U与伪标注样本集F中样本数量均为0;
步骤3、启动自学习功能,利用所述已标注样本集A与所述伪标注样本集F训练MLO深度学习网络和CC深度学习网络,并构建所述协同学习系统;
步骤4、将构建好的所述协同学习系统用于所述未标注样本集U,在每次迭代中逐一取出置信度最高的所述未标注样本,通过所述协同学习系统对其进行智能标注,从而获得所述伪标注样本集F,持续迭代到关闭所述自学习功能或是所述未标注样本集U中样本数量为0;
步骤5、当所述自学习功能关闭时,回到所述步骤2。
进一步地,所述步骤1还包括建立一个n*2的向量,n为所述未标注样本集U数量。
进一步地,所述标注方式为:0表示未标注,1表示用户人工标注,2表示计算机智能标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911266873.6/2.html,转载请声明来源钻瓜专利网。