[发明专利]基于场景的图像分类方法、装置、系统和存储介质有效
申请号: | 201910616087.8 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110490225B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 赵俊杰;王塑;刘宇 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;卜璐璐 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 场景 图像 分类 方法 装置 系统 存储 介质 | ||
本发明提供一种基于场景的图像分类方法、装置、系统和存储介质。该方法包括:接收输入图像,并基于训练好的神经网络对输入图像进行图像分类预测和场景分类预测,以得到图像分类得分和场景分类得分;基于场景分类得分确定输入图像的场景类别,并基于与场景类别相对应的映射函数对图像分类得分进行映射,以得到场景类别下输入图像的图像分类新得分;以及将图像分类新得分与预设统一阈值进行比较,以得到输入图像的图像分类结果。本发明的基于场景的图像分类方法、装置和系统对输入图像所属的场景进行分类,并根据场景分类结果对输入图像的图像分类预测值进行映射变换,使得不同场景的图像可采用统一阈值进行图像分类,且得到较好的图像分类结果。
技术领域
本发明涉及图像分类技术领域,更具体地涉及一种基于场景的图像分类方法、装置、系统和存储介质。
背景技术
图像分类(Image classification)是计算机视觉中一项非常重要的研究课题。随着深度学习的快速发展,基于卷积神经网络(convolution neural networks)的图像分类方法取得了很好的效果。
目前对于图像分类模型(如图像中的对象是否为猫,两个人脸图像是否为同一个人等),通常使用预测值+阈值的形式判断分类结果,即首先由模型给出输入图像的预测值,再根据预先定义的阈值判断其分类结果。但是考虑在实际生活中,不同场景(如不同人种、不同光照环境等)的图像常常差异较大,因此针对不同场景选定统一阈值会导致不同场景下图像分类的性能差异较大。
发明内容
为了解决上述问题而提出了本发明。本发明提出了一种基于场景的图像分类方案,其对输入图像所属的场景进行分类,并根据场景分类结果对输入图像的图像分类预测值进行映射变换,使得不同场景的图像可采用统一阈值进行图像分类,且得到较好的图像分类结果。下面简要描述本发明提出的基于场景的图像分类方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明一方面,提供了一种基于场景的图像分类方法,所述方法包括:接收输入图像,并基于训练好的神经网络对所述输入图像进行图像分类预测和场景分类预测,以得到图像分类得分和场景分类得分;基于所述场景分类得分确定所述输入图像的场景类别,并基于与所述场景类别相对应的映射函数对所述图像分类得分进行映射,以得到所述场景类别下所述输入图像的图像分类新得分;以及将所述图像分类新得分与预设统一阈值进行比较,以得到所述输入图像的图像分类结果。
在本发明的一个实施例中,不同的场景类别对应于不同的图像分类阈值,与任一场景类别相对应的所述映射函数是基于与所述任一场景类别相对应的图像分类阈值以及所述预设统一阈值而确定的。
在本发明的一个实施例中,与任一场景类别相对应的图像分类阈值通过如下方式来确定:采用所述训练好的神经网络对所述任一场景类别下的多个样本进行图像分类预测,得到所述多个样本各自的图像分类得分;以及基于所述多个样本各自的图像分类得分以及预设假正率来确定与所述任一场景类别相对应的图像分类阈值,其中所述假正率是指被错误分到正样本类别中真实的负样本所占所有负样本总数的比例。
在本发明的一个实施例中,所述场景分类预测包括:对所述输入图像或所述训练图像的多源数据进行分类预测。
在本发明的一个实施例中,所述多源数据包括所述输入图像或所述训练图像中的人种的类别。
在本发明的一个实施例中,所述多源数据包括所述输入图像或所述训练图像的光照情况。
在本发明的一个实施例中,所述预设统一阈值是自定义常数。
在本发明的一个实施例中,所述神经网络包括主干网络、图像分类子网络和场景分类子网络,所述图像分类子网络和所述场景分类子网络共享所述主干网络的参数,或者不共享所述主干网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910616087.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:训练神经网络的方法、装置、系统和存储介质
- 下一篇:一种识别方法及设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序