[发明专利]一种基于卷积神经网络的图像开放集识别方法有效
申请号: | 201910968936.6 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110909760B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 孙祥远;宋君强;任开军;李小勇;冷洪泽;邓科峰;汪祥;张卫华;任小丽 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 图像 开放 识别 方法 | ||
本发明公开了一种基于卷积神经网络的图像开放集识别方法,包括利用CNN模型对图像训练集进行处理,使用SoftMax层生成的深度特征作为激活向量;计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;确定目标样本是否为未知类别。本发明方法利用SoftMax变换对logits层所在的空间进行空间变换。经过变换后,这些方向指向的空间将收缩到变换后的特征空间中某些点附近,从而可以被CAP模型生成的边界所覆盖,因此能够改善卷积神经网络模型的开放集图像识别性能,本发明方法具有更强的性能和更好的适用度。
技术领域
本发明属于图像处理与识别领域,具体涉及基于卷积神经网络的图像开放集识别方法。
背景技术
目前,深度神经网络在各种视觉识别应用中取得了很大的成就,并已应用于人脸识别、自动驾驶、医学图像识别等多种商业场景。在建模过程中,这些识别任务大多采用封闭集假设,在这种情况下,所有可能的测试样本都属于训练集中已知的类别。然而,当模型应用到现实世界时,由于它无法识别不断出现的未知图像,它的性能将大幅下降。例如,当你站在一张合照前,你想从中辨认出一个你熟悉的人,但是合照中还有更多的你不认识的人和其他物体,如动物、建筑物、汽车,它们的存在会极大地影响你的识别。
现实世界中的识别任务可以分成三类:1)对已知类别的识别。即在训练集中打出明确标签的类别。2)对已知的未知类别的识别。即在训练集中常用的其他类别。3)对未知的未知类别的识别。即在训练集中没有出现过的类别。
传统的分类通常用于对已知类别分类以及拒绝已知未知类别,一般不考虑未知的未知类别。开放集识别(OSR)则主要关注对未知类别的拒绝。在接下来的描述中,统一将已知类别及已知的未知类别归纳于已知类别,未知的未知类别归纳于未知类别。
OSR是一个非常具有挑战性的问题,因为它要求模型在正确分类所有已知类别的条件下拒绝未知类别,找到已知空间和未知空间之间的精确平衡。对于未知类别,许多标准的概率和统计学习工具不能直接应用。为了在不对未知类别显式建模的条件下,衡量开放空间风险,有关学者提出紧致消减概率(CAP)模型,该模型假定属于该类成员的概率随着点从已知数向开放空间的激动而降低。CAP模型提供了解决OSR的新思路,一系列基于机器学习的方法也采用了这一模型。在此之后发展的基于卷积神经网络(CNN)的OSR方法也采用CAP模型作为基础,OpenMax方法作为第一个将CNN引入OSR领域的方法,在OSR领域中享有很高的声誉。它创新性地提出将CNN的倒数第二层逻辑层(logits层)用于生成OSR任务中需要的特征。这个想法极大地影响了后续的基于CNN的工作。
然而在实验和应用中发现,以逻辑层的空间为特征空间的方法中应用CAP模型是有风险的。因为logits层是CNN的输出层,所以这个空间中的值可以用来确定样本属于哪个已知类别。也就是说,在逻辑层的空间中存在一组方向,样本沿着这个方向移动得越远,属于已知类别的概率就越大,这是一个与CAP模型完全相反的结论,使得现有方法在利用基于卷积神经网络进行未知类型图像识别时可能得出错误的分类结论。
发明内容
有鉴于此,本发明的目的在于提供一种基于卷积神经网络的图像开放集识别方法,用于解决现有技术难以适用于卷积神经网络的开放集图像识别问题,从而导致现有技术可能带来的识别准确率和识别效率较低的缺陷。
基于上述目的,提供了一种基于卷积神经网络的图像开放集识别方法,包括以下步骤:
步骤1,利用CNN模型对图像训练集进行处理,使用SoftMax层生成的深度特征作为激活向量;
步骤2,计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;
步骤3,计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;
步骤4,确定目标样本是否为未知类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910968936.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序