[发明专利]图像物体识别方法和系统有效
申请号: | 201811443553.9 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109598298B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 冯建兴 | 申请(专利权)人: | 上海皓桦科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/70 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;潘晨 |
地址: | 201109 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 物体 识别 方法 系统 | ||
本发明属于图像识别技术领域,具体提供了一种图像物体识别方法和系统,旨在解决现有技术难以既保证准确地识别小物体又保证识别速度的问题。为此目的,本发明提供的图像物体识别方法包括获取目标图像对应的多个预设图像尺寸的待识别图像并且分别对每个待识别图像的像素坐标进行归一化处理,得到每个待识别图像的像素坐标矩阵;基于预先构建的图像物体识别网络并且根据每个待识别图像及其像素坐标矩阵,识别目标图像中对象的类别和位置信息。基于上述步骤,本发明提供的方法具有在不牺牲对大物体检测准确性的前提下,能够保证对小物体识别准确性的同时提高识别速度的有益效果。
技术领域
本发明属于图像识别技术领域,具体涉及一种图像物体识别方法和系统。
背景技术
识别图像中的对象是图像识别领域的经典问题。传统的图像对象识别方法主要包括三个步骤:第一、图像中候选框的确立;第二、计算每个候选框中图像块的特征;第三、根据特征进行分类。传统的图像对象识别方法准确度较低,现已逐步淘汰。
随着神经网络的发展,神经网络可以极大地提高对象识别的准确性。基于神经网络的图像对象识别方法是将图像作为神经网络的输入,将识别结果作为输出,不同的模型的实现方法不同。现有的基于神经网络的图像识别方法主要包括以下三种:
第一、基于RCNN系列模型,其中,RCNN系列模型包括RCNN,Fast RCNN,FasterRCNN,基于RCNN系列模型的图像对象识别方法包括两个阶段,第一阶段是计算候选物体框的位置,第二阶段是根据物体框进行分类;
第二、基于YOLO系列模型,其中,YOLO系列模型包括YOLO2和YOLO3,基于YOLO系列模型的图像对象识别方法只有一个阶段,与基于RCNN系列模型的图像对象识别方法相比,速度更快,但是对图像中尺寸较小的物体不敏感;
第三、基于SSD模型,该方法结合了Faster RCNN模型中的Anchor机制和YOLO模型识别速度快的优点,但是网络结构复杂,且需要较大的计算量。
现有的基于神经网络的图像识别方法都采用了Anchor机制,这种机制让所需要计算的物体框和预先设定的Anchor作比较,但是对于较小的密集物体或者重叠物体则无法很好地进行识别,若要实现较好的识别效果,需要预设大量的Anchor,但是同时又会降低计算速度,因此现有的基于神经网络的图像识别方法难以既保证准确地识别小物体又保证识别速度。
因此,如何提出一种在不牺牲对大物体检测准确性的前提下,能够保证对小物体识别准确性的同时提高识别速度的方案是本领域技术人员目前需要解决的问题。
发明内容
为了解决现有技术中的上述问题,即为了解决现有技术难以既保证准确地识别小物体又保证识别速度的问题,本发明的第一方面提供了一种图像物体识别方法,包括:
获取目标图像对应的多个预设图像尺寸的待识别图像并且分别对每个所述待识别图像的像素坐标进行归一化处理,得到所述每个待识别图像的像素坐标矩阵;
基于预先构建的图像物体识别网络并且根据所述每个待识别图像及其像素坐标矩阵,识别所述目标图像中对象的类别和位置信息;
其中,所述图像物体识别网络是基于预设的图像识别样本并利用机器学习算法所构建的神经网络。
在上述方法的优选技术方案中,所述图像物体识别网络包括多个按照网络层尺度由大至小顺次连接的编码网络以及多个按照网络层尺度由小至大顺次连接的解码网络;
其中,所述网络层尺度相同的编码网络与解码网络连接。
在上述方法的优选技术方案中,“基于预先构建的图像物体识别网络并且根据所述每个待识别图像及其像素坐标矩阵,识别所述目标图像中对象的类别和位置信息”的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海皓桦科技股份有限公司,未经上海皓桦科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811443553.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序