[发明专利]图像识别方法、装置及计算机可读存储介质有效
申请号: | 201810692204.4 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108960412B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 左鑫孟;刘晓;李旭峰 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06V10/82;G06V10/46;G06V10/764;G06K9/62 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 计算机 可读 存储 介质 | ||
本公开提供了一种图像识别方法、装置及计算机可读存储介质,涉及多媒体技术领域。其中的图像识别方法包括:利用深度学习神经网络提取待识别图像的深度特征;将待识别图像的深度特征与深度特征库中的深度特征进行匹配;将深度特征库中匹配的深度特征所属的图像类别作为待识别图像的图像类别。本公开利用深度学习神经网络提取待识别图像的深度特征,然后通过深度特征的匹配确定待识别图像所属的图像类别。因此,在分类不断增加的情况下无需对深度学习神经网络进行重复训练,就能够简单高效、较为准确的确定出待识别图像所属的图像类别。
技术领域
本公开涉及多媒体技术领域,特别涉及一种图像识别方法、装置及计算机可读存储介质。
背景技术
相似视觉信息识别是利用计算机视觉技术判断待识别图像是否存在数据库中,并召回指定的图片标签,以便确定待识别图像的类别。该技术可以同AR(Augmented Reality,增强现实)、VR(Virtual Reality,虚拟现实)等技术进行结合,应用于人工智能系统、个性推荐系统、工业分拣、智能机器人、智能交通等领域。
相关技术中的相似视觉信息识别算法主要分为两类。传统的基于底层特征的视觉信息识别方法,一般包括基于局部底层特征(尺度不变特征变换SIFT特征)描述和基于全局底层特征(颜色直方图特征)描述的方法;而基于深度模型进行视觉信息识别的方法,可以基于Alexnet、VGG、GoogleNet、Resnet等分类模型来实现直接对图像进行分类。
发明内容
发明人研究发现,传统的基于底层特征的视觉信息识别方法是基于规则的方法。当待识别图像处于光照变换、物体遮挡、相似物干扰的情况下,基于底层特征的视觉信息识别方法会出现较多误识别以及匹配失败的情况,泛化能力较差。而基于深度模型进行视觉信息识别的方法虽然具有较好的效果,但是需要收集大量的待识别类目对分类模型进行分类训练,每出现一个新的分类都需要大量的训练图片以及训练时间对深度模型进行重新离线训练,消耗的成本较高。如果有新的分类频繁增加,要想得到较好的效果就需要对模型进行重新训练,这样显然无法即时响应分类不断增加的需求。
本公开解决的一个技术问题是,如何简单高效的识别出图像所属的图像类别。
根据本公开实施例的一个方面,提供了一种图像识别方法,包括:利用深度学习神经网络提取待识别图像的深度特征;将待识别图像的深度特征与深度特征库中的深度特征进行匹配;将深度特征库中匹配的深度特征所属的图像类别作为待识别图像的图像类别。
在一些实施例中,利用深度学习神经网络提取待识别图像的深度特征包括:从深度学习神经网络中层号小于第一阈值的神经层中,提取待识别图像的低层深度特征;从深度学习神经网络中层号大于第二阈值的神经层中,提取待识别图像的高层深度特征,第二阈值大于第一阈值;将低层深度特征与高层深度特征级联,得到待识别图像的深度特征。
在一些实施例中,将待识别图像的深度特征与深度特征库中的深度特征进行匹配包括:计算待识别图像的深度特征与深度特征库中的深度特征之间的特征距离;若深度特征库中存在深度特征集,深度特征集中的深度特征与待识别图像的深度特征之间的特征距离小于第三阈值,则将深度特征集中与待识别图像的深度特征之间的特征距离最小的深度特征所属的图像类别,作为待识别图像的图像类别。
在一些实施例中,图像识别方法还包括:提取待识别图像的底层特征;将待识别图像的底层特征与底层特征库中的底层特征进行匹配;若底层特征库中不存在匹配的底层特征,则继续执行前述的深度特征匹配的步骤。
在一些实施例中,提取待识别图像的底层特征包括:提取待识别图像的局部底层特征;提取待识别图像的全局底层特征;将局部底层特征与全局底层特征级联,得到待识别图像的底层特征。
在一些实施例中,图像识别方法还包括:利用训练图像对深度学习神经网络进行训练,使得深度学习神经网络能够利用输入图像提取输入图像的深度特征;利用深度学习神经网络提取不同类别图像的深度特征,并利用不同类别图像的深度特征组成深度特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810692204.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序