[发明专利]一种基于深度学习的分类器模型的训练方法在审
申请号: | 202011534218.7 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112541555A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 谭海宁;沈建雄;戎天华;冯尔维 | 申请(专利权)人: | 中国医学科学院北京协和医院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京慧尚知识产权代理事务所(特殊普通合伙) 11743 | 代理人: | 郑德龙;鲍晓芳 |
地址: | 100070 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 分类 模型 训练 方法 | ||
1.一种基于深度学习的分类器模型的训练方法,其特征在于,包括以下步骤:
步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签,带有所述分类标签的所述原始医学图像组成第一数据集;
步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像,所述感兴趣区域图像组成第二数据集;
步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像,所述初步扩充图像组成第三数据集;
步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像,所述进一步扩充图像组成第四数据集;
步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型;
步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1,利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2,利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3,q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值;以及
步骤7、将所述第二数据集、所述第三数据集以及所述第四数据集输入到所述目标分类器模型重新进行训练并得出分类准确率值q4,q4分别大于q1、q2或q3,
其中,所述第二数据集、所述第三数据集以及所述第四数据集的数据量相等。
2.根据权利要求1所述的基于深度学习的分类器模型的训练方法,其特征在于,所述生成式对抗网络模型的训练过程为:基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练。
3.根据权利要求2所述的基于深度学习的分类器模型的训练方法,其特征在于,基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练,包括:
生成步骤:固定所述判别器的参数,将所述预设随机分布噪声输入到所述生成器中以输出生成图像;
判别步骤:固定所述生成器的参数,将所述生成图像和所述第二数据集输入到所述判别器中以输出真假概率值;
优化步骤:将所述真假概率值传递到所述生成器,使用优化器优化所述判别器和所述生成器;
重复所述生成步骤、所述判别步骤以及所述优化步骤,直到获得满足预设条件的损失函数值,得到训练好的生成器和判别器。
4.根据权利要求3所述的基于深度学习的分类器模型的训练方法,其特征在于,所述步骤4进一步包括:将所述预设随机分布噪声输入到所述训练好的生成器中生成所述进一步扩充图像。
5.根据权利要求4所述的基于深度学习的分类器模型的训练方法,其特征在于,所述预设随机分布噪声为100维随机高斯噪声。
6.根据权利要求1所述的基于深度学习的分类器模型的训练方法,其特征在于,所述第二数据集、所述第三数据集以及所述第四数据集中的图像均包含所述分类标签。
7.根据权利要求1所述的基于深度学习的分类器模型的训练方法,其特征在于,所述步骤2进一步包括:
计算出所述第一数据集中的所述原始医学图像中的感兴趣区域;和
将所述感兴趣区域从所述原始医学图像中裁剪出来作为所述感兴趣区域图像。
8.根据权利要求1所述的基于深度学习的分类器模型的训练方法,其特征在于,q1=q2=q3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院北京协和医院,未经中国医学科学院北京协和医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011534218.7/1.html,转载请声明来源钻瓜专利网。