[发明专利]一种基于均衡互补熵的长尾图像分类方法及系统在审
申请号: | 202210500992.9 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114821184A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 杨钊;胡陆宇;李嘉壕;罗名凯;曹任龙 | 申请(专利权)人: | 广州大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/774;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州高炬知识产权代理有限公司 44376 | 代理人: | 孙明科 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 均衡 互补 长尾 图像 分类 方法 系统 | ||
1.一种基于均衡互补熵的长尾图像分类方法,其特征在于,包括:
步骤1、获取长尾图像训练集,针对长尾图像训练集,读取图像数据及标签;
步骤2、随机初始化卷积神经网络参数,采用mini-batch的方式对提取的图像数据进行前向计算,得到全连接层输出,并计算Softmax预测概率;
步骤3、设计均衡互补熵损失函数,通过在归一化的互补熵损失函数中引入一个自适应权重系数,得到均衡互补熵损失函数,然后利用Softmax预测概率计算互补类的损失;
步骤4、联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练,引导网络模型参数更新,得到图像分类模型。
2.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述读取图像数据,包括:
读取输入图像的像素矩阵,用于后续的图像视觉特征处理。
3.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述得到全连接层输出,并计算Softmax预测概率,包括:
采用卷积神经网络模型提取步骤1中输入长尾图像的像素矩阵,进行卷积层、激活函数层和池化层等前向计算处理,得到全连接层输入,根据全连接层输入得到全连接层输出,然后采用Softmax激活函数计算得到图像的Softmax预测概率。
4.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述自适应权重系数表达式为:
其中,wj表示互补类(不正确类)j的权重系数,nj表示互补类j的样本数,nsum表示全部样本数,α是一个超参数设置。
5.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述引入自适应权重系数,得到均衡互补熵损失函数为:
其中,N表示全部样本数量;K表示类别数;表示第s个样本被正确分类为ground-truth类i的概率;表示第s个样本被错误地分类为互补类j的概率。
6.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述联合交叉熵损失函数与均衡互补熵损失函数进行训练,引导模型参数的更新,其中,交叉熵损失函数的公式如下:
其中,psi表示当前样本属于ground-truth类i的概率。
7.根据权利要求1所述的基于均衡互补熵的长尾图像分类方法,其特征在于,所述图像分类模型为:
其中,是用于归一化的平衡因子,主要用于平衡交叉熵损失和互补熵损失之间的数值比例。
8.基于均衡互补熵的长尾图像分类系统,其特征在于,其包括如下模块:
数据集处理模块,用于获取长尾图像训练集,针对长尾图像训练集,读取图像数据及标签;
预测概率计算模块,用于随机初始化卷积神经网络参数,采用mini-batch的方式对提取的图像数据进行前向计算,得到全连接层输出,并计算Softmax预测概率;
均衡互补熵训练模块,用于设计均衡互补熵损失函数,通过在归一化的互补熵损失函数中引入一个自适应权重系数,得到均衡互补熵损失函数,然后利用Softmax预测概率计算互补类的损失;
分类模型获取模块,用于联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练,引导网络模型参数更新,得到图像分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210500992.9/1.html,转载请声明来源钻瓜专利网。