[发明专利]一种对形变图像的目标识别方法及装置在审
申请号: | 201710457725.7 | 申请日: | 2017-06-16 |
公开(公告)号: | CN109145927A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 许昀璐;郑钢;程战战;钮毅 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/02 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 目标识别 形变 校正 定位参数 图像输入 预设 定位网络 空间变换 目标分类 神经网络 图像卷积 图像特征 特征图 预设定 卷积 网络 回归 | ||
本发明实施例提供了一种对形变图像的目标识别方法及装置,所述方法包括:将待识别图像输入预设定位网络,获取所述待识别图像的多个定位参数,所述定位网络包括预设个卷积层,所述多个定位参数是所述待识别图像卷积后得到的特征图中的图像特征回归后得到的;根据所述多个定位参数,对所述待识别图像进行空间变换,得到校正后的待识别图像;将所述校正后的待识别图像输入预设识别网络,获取所述待识别图像的目标分类结果。本发明实施例在基于神经网络的目标识别过程中,先对形变图像进行校正,基于校正后的图像进行目标识别,能够减少形变对目标识别的干扰,因此本发明实施例能够针对形变图像,提高目标识别的准确性。
技术领域
本发明涉及图像识别领域,特别是涉及一种对形变图像的目标识别方法及装置。
背景技术
随着神经网络技术的发展,基于图像的目标识别技术得到了迅速发展。基于神经网络的目标识别方法是利用神经网络的自主学习特性,提取图像特征,获得目标的分类结果,也就是目标的识别结果。相比于传统的目标识别方法,能够提高目标识别的准确率,且能够识别的目标的类型也更广泛,如人、动物、植物、建筑物、车辆、字符等等。
现有的基于神经网络的目标识别方法,使用深度神经网络模型对图像进行目标识别,但目标识别的过程中未考虑在复杂场景中,由于拍摄或其他原因导致的目标的形变对目标识别带来的影响,如图像拍摄过程中拍摄视角变化带来的目标的倾斜、缩放和透视变换等,或自然场景中目标的人为形变,如字符识别中遇到的字体设计和变化带来的倾斜、扭曲等。针对形变图像,现有的基于神经网络的目标识别方法将形变大的目标直接进行分类,导致目标识别的准确率降低。
发明内容
本发明实施例的目的在于提供一种对形变图像的目标识别方法及装置,能够针对形变图像,提高目标识别的准确性。具体技术方案如下:
本发明实施例公开了一种对形变图像的目标识别方法,包括:
将待识别图像输入预设定位网络,获取所述待识别图像的多个定位参数,所述定位网络包括预设个卷积层,所述多个定位参数是所述待识别图像卷积后得到的特征图中的图像特征回归后得到的;
根据所述多个定位参数,对所述待识别图像进行空间变换,得到校正后的待识别图像;
将所述校正后的待识别图像输入预设识别网络,获取所述待识别图像的目标分类结果。
可选的,所述将待识别图像输入预设定位网络,获取所述待识别图像的多个定位参数,包括:
利用所述预设个卷积层对所述待识别图像提取图像特征,获得含有图像特征的待识别图像的特征图;
利用预设定位网络中的全连接层,对所述待识别图像的特征图中的图像特征进行回归处理,获取所述待识别图像的多个定位参数,所述定位参数为,待识别图像中,与校正后的待识别图像中预设数量个基准点的图像特征匹配的像素点的坐标。
可选的,所述根据所述多个定位参数,对所述待识别图像进行空间变换,得到校正后的待识别图像,包括:
根据预设数量个基准点对应的定位参数、预设数量个基准点在校正后的待识别图像中的坐标,获取基准点在待识别图像和校正后的待识别图像之间的空间变换关系;
根据所述空间变换关系,获得待识别图像中所有像素点对应在校正后的待识别图像中的坐标,获得校正后的待识别图像。
可选的,所述根据预设数量个基准点对应的定位参数、预设数量个基准点在校正后的待识别图像中的坐标,获取基准点在待识别图像和校正后的待识别图像之间的空间变换关系,包括:
根据预设数量个基准点对应的定位参数、预设数量个基准点在校正后的待识别图像中的坐标,获得将基准点在待识别图像中的坐标变换为基准点在校正后的待识别图像中的坐标的预设变换算法所需要的变换参数,所述预设变换算法包括仿射变换算法、透视变换算法、薄板样条变换算法之一;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710457725.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相似图片识别方法及计算机设备
- 下一篇:一种基于图像的车头朝向识别方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序