[发明专利]一种图像分类方法有效
申请号: | 201910659392.5 | 申请日: | 2019-07-22 |
公开(公告)号: | CN110472669B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张珂;王新胜;郭玉荣;何颖宣 | 申请(专利权)人: | 华北电力大学(保定) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 王新月 |
地址: | 071003 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 | ||
本申请提出了一种图像分类方法,涉及一种竞争比损失函数,竞争比损失函数加大了正确类和竞争类的差距,采用该竞争比损失函数训练深度卷积神经网络,得到训练好的基于竞争比损失函数的深度卷积神经网络,因为基于竞争比损失函数的深度卷积神经网络中的竞争比损失函数加大了正确类和竞争类的差距,所以使用基于竞争比损失函数的深度卷积神经网络对图像进行分类能够提高图像分类的准确率。
技术领域
本申请属于图像领域,尤其涉及一种图像分类方法。
背景技术
随着互联网的快速发展,图像成为人们传递信息、获取信息的重要载体,图像数量迅速增长,如何对图像进行快速、有效的分析和处理,并对图像进行识别和分类越来越重要。首先,通过人工的方式对数量上万的图像进行分类是不可行的。其次,人们可以通过检索关键词来对文字信息进行信息提取,而无法对图片信息进行检索和处理。因此,如何通过人工智能的方法实现图像的识别与分类已成为计算机视觉领域的研究热点。目前,图像分类在字符识别技术、人脸识别、物体识别、行人检测、图像检索等方面都有广泛的应用。
目前深度卷积神经网络(Deep Convolutional Neural Network,DCNN)已经成为图像分类的主流方法。卷积神经网络是通过模拟人类的视觉系统来产生分类结果的,它将特征提取与图像分类融合在了一起。2012年,AlexNet在ImageNet大赛上横空出世,一举夺得当年ImageNet图像分类挑战赛冠军。自此人们陆续研究出很多基于DCNN的分类方法,这些方法相对于传统方法,图像分类准确性有着很大的提高,比如GoogleNet、VGGNet、ResNet和DenseNet等。在图像分类任务中,DCNN通过提取输入图像的深层特征,学习输出图像类别的分布。其学习目标为减小由DCNN输出的图像类别分布和图像真实的类别分布的差距。为量化这一学习目标,损失函数应运而生。损失函数(loss function)也叫代价函数(costfunction),是DCNN优化的目标函数,DCNN训练或者优化的过程就是最小化损失函数的过程。在DCNN训练的过程中,均方差损失函数(mean square error loss,MSE)、折页损失函数(hinge loss)、交叉熵损失函数(cross-entropy loss,CE)等常见的损失函数扮演了重要角色。与另外两种损失函数相比,CE在网络训练过程中收敛速度快,逐渐成为DCNN图像分类网络训练过程中使用最频繁的损失函数。
申请内容
现有技术中,根据维基百科的定义,基于相同事件测度的两个概率分布p和q的交叉熵(cross-entropy)是指,当基于一个“非自然”(相对于“真实”分布p而言)的概率分布q进行编码时,在事件集合中唯一标识一个事件所需要的平均比特数(bit)。在实际应用时,如基于DCNN的图像分类网络训练时,分布q是未知的,通常情况下被由训练集产生的经验概率分布替代。训练集的每一个样本均独立同分布(i.i.d)。在图像特征空间和图像标签空间均服从均匀分布时,根据贝叶斯推断,CE为训练图像的负对数似然值(negative loglikelihood)。所以在训练DCNN时,最小化CE与最大化训练图像的负对数似然值等价。最大似然(maximum likelihood)是机器学习中常见的一种训练准则(criterion)。利用这一准则训练DCNN进行图像分类时,网络学习输入图像正确类的似然值(likelihood)。网络利用贝叶斯准则(Bayes rules)计算输入图像的所属类别先验概率,预测图像最可能所属的类别。
假设在基于DCNN的图像分类任务中,全部图像具有C个目标类别(targetclasses)。DCNN采用图像xi作为输入并输出C个节点,每个节点的输出代表每个目标类别对应的预测分数。当DCNN的输出层的激活函数为softmax函数时,节点的输出可以视为对应目标类别的先验概率:其中x为DCNN的输入向量。基于以上条件,CE定义如公式(1)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定),未经华北电力大学(保定)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910659392.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像分类方法
- 下一篇:图像中线检测方法、计算机设备和存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序