[发明专利]一种基于深度学习多权重损失函数的数据均衡方法有效
申请号: | 202110078808.1 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112766379B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 徐梦娟;姚鹏;申书伟;邵鹏飞 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06N3/084 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 权重 损失 函数 数据 均衡 方法 | ||
1.一种用于皮肤图像分类的深度学习模型训练方法,其特征在于:包括以下内容:
步骤1:获取目标图像数据集,根据目标图像数据集确定图像数据样本的类别数目I和每类图像数据样本数量Ni,Ni为第i类别的图像数据样本数量;所述目标图像数据集为用于医学影像的皮肤图像HAM10000数据集;该数据集包含7种类别;
其中包括黑色素痣、黑色素瘤、良性角化病变、基底细胞癌、光化性角化病、血管病变和皮肤纤维瘤的图像;
步骤2:构建神经网络模型架构,对训练样本数据进行预处理,并将处理后的训练样本输入到模型中进行训练;确定超参数α、γ和每类图像数据样本类别的加权系数Ci,分别用来调节不同权重的作用范围;Ci,α、γ的取值均大于0,根据所述目标图像数据集设定初始值,选定初始值后,在训练神经网络模型时进一步搜索寻优,确定具体值;
步骤3:确定多权重损失函数,此多权重损失函数用以下公式表示:
式中,z表示图像样本的预测值,y表示图像样本的真实值;在等式右边中,I表示图像数据样本的类别数目,Ci表示每一类别图像数据样本重要性的加权系数;表示输出预测正确的概率,其定义为:
其中zi表示图像样本在第i类上的预测值,y为图像样本的标签真值;
步骤4:开始深度学习模型的迭代训练,在每一次迭代训练过程中使用多权重损失函数进行误差计算,并使用反向传播算法,更新模型参数的值,将多权重损失函数用于神经网络模型训练的反向传播过程中,并利用不同的权重来对应不同图像数据样本进行损失计算,从而缓解不同类别图像数量不均衡和图像分类难度不均衡的问题的影响;
步骤5,重复上述步骤4,不断迭代直至深度学习模型训练收敛,最终得到一个所有参数值确定的深度学习模型,将深度学习模型用于对所述目标图像数据集进行皮肤图像检测和分类,得到更好的分类准确率;
所述步骤1中所述图像数据样本的类别包括关键类别图像数据样本和普通类别图像数据样本,所述关键类别是指在训练时需要重点关注的图像数据样本类别;此外,同一类中的图像数据样本也分为困难图像数据样本和简单图像数据样本,所述困难图像数据样本是指在训练时难以分类的图像数据样本;
步骤2中所述图像数据样本的类别数目中的图像数据样本类为关键类时,Ci取大于1的数值,选取黑色素瘤为关键类,超参数α、γ取值越大,多数量图像数据样本类别和类内简单图像数据样本的权重降低速率越快;
所述步骤3中令权重wi用来处理不同类别图像样本数量不均衡问题的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110078808.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高空修枝回收一体机
- 下一篇:一种成像精度高的红外热成像仪