[发明专利]图像识别方法、装置、电子设备和计算机可读介质在审
申请号: | 202010098022.1 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111291817A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 王塑;窦毅琨;刘宇;王亚可;王泽荣 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 计算机 可读 介质 | ||
本发明提供了一种图像识别方法、装置、电子设备和计算机可读介质,涉及图像处理的技术领域,包括获取待识别图像;并将待识别图像输入至目标神经网络中,得到待识别图像的特征信息和待识别图像的重构图像,其中,目标神经网络包括特征提取网络和重构网络;基于待识别图像的特征信息和目标分类特征信息计算目标损失函数,以及基于重构图像计算目标神经网络中重构网络的重构损失函数;基于目标损失函数和重构损失函数确定待识别图像的样本类型,本申请缓解了在采用传统图像分类方法确定图像的样本类型时,分类准确度较差的技术问题。
技术领域
本发明涉及图像处理的技术领域,尤其是涉及一种图像识别方法、装置、电子设备和计算机可读介质。
背景技术
当前,训练处理遮挡、活体、检测等开集问题时,往往是通过同时采集正样本数据和负样本数据来训练神经网络模型。但是,在开集问题中,负样本数据类型几乎是无法穷尽的。这给开集问题的训练带来非常大的困难。以遮挡问题为例,负样本中采集一些遮挡类型后,如手、比等物体后,其很难保证在树叶、座椅等物体遮挡上同样能够实现准确的识别率。
为了解决开集问题,传统技术存在以下几种方法:
方法一、在特征空间中判断待分类样本到已分类样本之间的L2距离。其中,L2距离越大,则样本为负样本的可能性越大;
方法二、在训练分类问题的同时,同时训练重构问题。即将训练原图首先变换到特征,再由特征变换到恢复图,从而通过判断原图和恢复图的之间精确度,来判断样本是否为负样本,其中,负样本恢复的精度更小。
但是,上述方法存在以下问题:当特征提取模型对待分类样本和已分类样本进行处理后,存在可能,使待分类样本和已分类样本这两张图在相同的特征空间上,而这会导致方法一失效,无法进行判断。而方法二,一种特殊情况是,当特征提取模型保留了所有的原图信息时,总是存在方法将特征图重构回原图,从而使方法失效。
发明内容
有鉴于此,本发明的目的在于提供一种图像识别方法、装置、电子设备和计算机可读介质,以缓解了在采用传统图像分类方法确定图像的样本类型时,分类准确度较差的技术问题。
第一方面,本发明实施例提供了一种图像识别方法,包括:获取待识别图像;并将所述待识别图像输入至目标神经网络中,得到所述待识别图像的特征信息和所述待识别图像的重构图像,其中,所述目标神经网络包括特征提取网络和重构网络;基于所述待识别图像的特征信息和目标分类特征信息计算目标损失函数,以及基于所述重构图像计算所述目标神经网络中重构网络的重构损失函数,其中,所述目标分类特征信息为特征提取网络确定出的所述待识别图像所属分类的特征信息;基于所述目标损失函数和所述重构损失函数确定所述待识别图像的样本类型。
进一步地,所述目标神经网络包括以下至少之一:单类型神经网络、多类型神经网络和未知多类型神经网络;所述单类型神经网络的分类类别为一种;所述多类型神经网络的分类类别为多种;所述未知多类型神经网络的分类类别为多种,且多种分类类别中包含已知分类类别和未知分类类别。
进一步地,所述目标神经网络为所述单类型神经网络;基于所述目标损失函数和所述重构损失函数确定所述待识别图像的样本类型包括:获取第一损失阈值和第二损失阈值;若所述目标损失函数大于所述第一损失阈值,和/或,所述重构损失函数大于所述第二损失阈值,则确定所述待识别图像的样本类型为负样本。
进一步地,所述目标神经网络为所述多类型神经网络;所述方法还包括:获取所述特征提取网络的各个分类类别的分类特征信息;基于所述待识别图像的特征信息和所述分类特征信息计算所述待识别图像所属于每个分类类别的第一预测概率,得到多个第一预测概率;基于所述多个第一预测概率在多个分类类别确定所述待识别图像所属的目标分类类别;将所述目标分类类别对应的特征信息确定为所述目标分类特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098022.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于识别文字的方法和装置
- 下一篇:天线切换电路、天线切换方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序