[发明专利]图像识别方法及装置、计算机可读介质有效
申请号: | 201710963258.5 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107798344B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 朱德伟;李树前;李伟奇;稂顾 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 柯瑞京 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 计算机 可读 介质 | ||
本公开提供了一种图像识别方法及装置、计算机可读介质。根据实施例的图像识别方法利用人工神经网络来识别在原始图像中是否包含目标图像,包括:轮廓信息获取操作(S1),利用所述人工神经网络的降维算法,从所述原始图像中获取该原始图像的全局轮廓信息;目标图像区域获取操作(S2),根据所述全局轮廓信息和所述目标图像的样本,从所述原始图像中获取与所述目标图像相似的图像区域作为目标图像区域;图像识别操作(S3),针对获取的所述目标图像区域,利用所述目标图像的所述样本,进行基于所述人工神经网络的升维算法的图像识别。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种利用人工神经网络技术的图像识别方法及装置、计算机可读介质。
背景技术
随着计算机技术尤其是人工智能的快速发展,人工神经网络技术被越来越多地应用于诸多技术领域。近年,尤其在图像识别技术中,人工神经网络技术(例如,bp神经网络技术、深度学习技术、模板匹配技术等)正不断得到广泛应用。
但是,在实现本发明的过程中,本发明人发现在现有技术中至少存在如下问题。例如,在现有应用于图像识别的人工神经网络技术中,由于并没有考虑到先验知识,而容易将图像细节当做特征,有时会导致图像过拟合而影响图像识别的精度。而且,对整个原始图像进行基于人工神经网络(尤其是全连接神经网络)的图像识别会产生很大运算量。因此,如何能够在降低运算量的同时还提高图像识别精度一直是困扰本领域技术人员的一个课题。
发明内容
有鉴于此,本公开的目标至少部分地在于提供一种能够在相对小的计算量下相对准确地识别图像的图像识别方法及装置、计算机可读介质。
本公开的一个方面提供了一种图像识别方法,利用人工神经网络来识别在原始图像中是否包含目标图像,该方法包括:轮廓信息获取操作,人工神经网络的降维算法,从所述原始图像中获取该原始图像的全局轮廓信息;目标图像区域获取操作,根据所述全局轮廓信息和所述目标图像的样本,从所述原始图像中获取与所述目标图像相似的图像区域作为目标图像区域;图像识别操作,针对获取的所述目标图像区域,利用所述目标图像的所述样本,进行基于所述人工神经网络的升维算法的图像识别。
根据本公开一个方面的图像识别方法,所述目标图像区域获取操作包括:将获取的所述全局轮廓信息与所述目标图像的样本的轮廓信息做卷积运算;从所述原始图像中获取出经所述卷积运算所得的值大于规定阈值的图像区域作为所述目标图像区域。
根据本公开一个方面的图像识别方法,所述降维算法是指所述人工神经网络中的隐藏层的维数即神经元数量小于输入层的维数即神经元数量的算法,所述升维算法是指所述人工神经网络中的所述隐藏层的维数即神经元数量大于所述输入层的维数即神经元数量的算法。
根据本公开一个方面的图像识别方法,所述降维算法是基于稀疏编码的算法。
根据本公开一个方面的图像识别方法,在所述基于稀疏编码的算法中,隐藏层对来自输入层的信息进行压缩,而在输出层进行解压缩。
根据本公开一个方面的图像识别方法,所述升维算法是基于卷积神经网络的算法。
根据本公开一个方面的图像识别方法,所述卷积神经网络是全连接卷积神经网络。
根据本公开一个方面的图像识别方法,所述图像识别操作还包括:在所述图像识别的输出结果为相似度概率大于规定概率值时,识别为在所述原始图像中包含所述目标图像。
本公开的另一个方面提供了一种图像识别装置,利用人工神经网络来识别在原始图像中是否包含目标图像,该图像识别装置包括:轮廓信息获取单元,述人工神经网络的降维算法,从所述原始图像中获取该原始图像的全局轮廓信息;目标图像区域获取单元,根据所述全局轮廓信息和所述目标图像的样本,从所述原始图像中获取与所述目标图像相似的图像区域作为目标图像区域;图像识别单元,针对获取的所述目标图像区域,利用所述目标图像的所述样本,进行基于所述人工神经网络的升维算法的图像识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963258.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序