[发明专利]一种通过协同主动学习模型的乳腺癌数据标注方法有效
申请号: | 201911266873.6 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111128373B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 顾力栩;杨智凯;赵愉;马愈祥;张宏 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06T7/00;G06N3/0464;G06N3/08 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 协同 主动 学习 模型 乳腺癌 数据 标注 方法 | ||
1.一种通过协同主动学习模型的乳腺癌数据标注方法,其特征在于,包括主动学习系统和协同学习系统;所述主动学习系统用于从样本集中取出有价值的样本供标注;所述协同学习系统通过神经网络训练后,对所述主动学习系统提供的所述有价值的样本数据进行标注;
所述方法包括以下步骤:
步骤1、建立未标注样本集U,用于存储各未标注样本的标注信息与标注方式;
步骤2、通过所述主动学习系统,在所述未标注样本集U中逐一取出最有价值的样本进行人工标注,并将标注好的样本加入到已标注样本集A,该过程将持续迭代到启动自学习功能或是所述未标注样本集U与伪标注样本集F中样本数量均为0;
步骤3、启动自学习功能,利用所述已标注样本集A与所述伪标注样本集F训练MLO深度学习网络和CC深度学习网络,并构建所述协同学习系统;
步骤4、将构建好的所述协同学习系统用于所述未标注样本集U,在每次迭代中逐一取出置信度最高的所述未标注样本,通过所述协同学习系统对其进行智能标注,从而获得所述伪标注样本集F,持续迭代到关闭所述自学习功能或是所述未标注样本集U中样本数量为0;
步骤5、当所述自学习功能关闭时,回到所述步骤2。
2.如权利要求1所述的方法,其特征在于,所述步骤1还包括建立一个n*2的向量,n为所述未标注样本集U数量。
3.如权利要求1所述的方法,其特征在于,所述标注方式为:0表示未标注,1表示用户人工标注,2表示计算机智能标注。
4.如权利要求1所述的方法,其特征在于,所述步骤2中所述主动学习系统采用的是MDAL算法。
5.如权利要求1所述的方法,其特征在于,所述步骤2中所述最有价值的样本的选取,基于多样性准则进行筛选,确保选出的样本与已标注样本差异最大。
6.如权利要求1所述的方法,其特征在于,所述步骤2中所述最有价值的样本的选取,基于版本空间准则进行筛选,确保选择出的样本在所述MLO和所述CC体位的预测差异最大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911266873.6/1.html,转载请声明来源钻瓜专利网。