[发明专利]一种深度学习的训练方法有效
申请号: | 202010221098.9 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111126576B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 代笃伟;赵威;申建虎;王博;张伟 | 申请(专利权)人: | 北京精诊医疗科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 赵娜 |
地址: | 102629 北京市大兴区中关村科技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 训练 方法 | ||
1.一种深度学习的训练方法,其特征在于,具体包括以下步骤:
步骤1,从图像数据集中随机抽取多类别,获取与上述类别对应的在图像数据集之外的图片,组成数据集;
步骤2,将数据集按比例分为训练集data_0和测试集data_1,将训练集输入深度神经网络,得到模型model_0;
步骤3,使用模型model_0预测测试集data_1中的样本,计算预测结果和真实结果之间的差异,得到预测的准确率acc_0,记录预测得到的测试集data_1中样本的伪标签;
步骤4,将训练集data_0和带有伪标签的样本数据合并记为训练集data_2,训练集data_2输入深度神经网络,每次训练后测试模型model_0针对测试集data_1的准确率;
步骤5,若准确率连续n次小于准确率acc_0,则将准确率acc_0更新为n次准确率的平均值,从测试集data_1中取出10%的数据及其真实标签合并到训练集data_0中,重复步骤4;
步骤6,若准确率连续n次大于准确率acc_0,则将准确率acc_0更新为n次准确率的平均值,记录n次准确率中最高一次对应的模型为model_1,从训练集data_0中拿出10%的数据放入测试集data_1中,用模型model_1预测测试集data_1的伪标签,更新测试集data_1的伪标签,重复步骤4;
步骤7,若训练集data_0中的数据全部移至测试集data_1后,经过5次训练后停止训练;或者训练集data_0和测试集data_1处于平衡状态后停止训练。
2.根据权利要求1所述的一种深度学习的训练方法,其特征在于,步骤1具体包括,从图像数据集imageNet2012中随机抽样100个类别,获取与上述100个类别对应的在图像数据集之外的图片,每个类别10张图片,组成数据集。
3.根据权利要求1所述的一种深度学习的训练方法,其特征在于,步骤2具体包括,将数据集按4:6的比例分为训练集data_0和测试集data_1,将训练集输入深度神经网络,得到模型model_0。
4.根据权利要求1所述的一种深度学习的训练方法,其特征在于,步骤4具体包括,将训练集data_0和带有伪标签的样本数据合并记为训练集data_2,训练集data_2输入深度残差网络resnet50,每次训练后测试模型model_0针对测试集data_1的准确率。
5.根据权利要求1所述的一种深度学习的训练方法,其特征在于,步骤5具体包括,若准确率连续5次小于准确率acc_0,则将准确率acc_0更新为5次准确率的平均值,从测试集data_1中取出10%的数据及其真实标签合并到训练集data_0中,重复步骤4。
6.根据权利要求1所述的一种深度学习的训练方法,其特征在于,步骤6具体包括,若准确率连续5次大于准确率acc_0,则将准确率acc_0更新为5次准确率的平均值,记录5次准确率中最高一次对应的模型为model_1,从训练集data_0中拿出10%的数据放入测试集data_1中,用模型model_1预测测试集data_1的伪标签,更新测试集data_1的伪标签,重复步骤4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京精诊医疗科技有限公司,未经北京精诊医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010221098.9/1.html,转载请声明来源钻瓜专利网。