[发明专利]一种自适应层级的图像切分识别方法、装置及系统有效
申请号: | 202010817355.5 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111738236B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 毛旷;王跃锋;任祖杰;杨弢;银燕龙;曾令仿;何水兵;陈刚 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 应孔月 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 层级 图像 切分 识别 方法 装置 系统 | ||
本发明公开了一种自适应层级的图像切分识别方法、装置及系统,该方法包括:获取高清视频中某一帧的原始图像;对所述原始图像,进行图像切分,得到若干有像素重叠的图像切片;对子图像切片进行迭代切分并识别;最终对所有识别结果进行选择得到最终图像的识别结果。本发明解决了现有对高清图像物体识别存在的速度慢、小物体检出率低的问题,做到了高清图像中物体识别速度快、检出率高的效果。
技术领域
本发明涉及高清图像识别技术领域,尤其涉及一种自适应层级的图像切分识别方法、装置及系统。
背景技术
在人口密集场所进行行人识别需要利用高清摄像头与物体识别技术,而传统的物体识别要求控制图像像素在一个比较小的尺寸以提升识别效率,适应识别设备的缓存要求。但是压缩图像至固定尺寸会导致丢失大量中小物体信息,尤其是对火车站、广场人口密集区域。利用4K与8K分辨率等高清视频采集设备进行监控,需要解决对视频流中高分辨率图像进行实时准确的物体识别。
高分辨率视频流中的往往包含了大量物体信息,如一个安装在火车站内的摄像头,其覆盖的面积会非常大,其拍摄的图像中包含了大量从进到远的各类物体,对于远端的物体,在视频流的图像中占有的像素比较非常低。针对高分辨率图像的这个特点,对其中的物体进行全面、快速的识别主要存在三大挑战。
首先是识别精度的问题,目前现有的物体识别算法如ssd接受的图片的分辨率比较低,如300*300,该类算法会对输入图片的分辨率进行压缩,以满足其接受的尺寸,但是高分辨率图像在经过resize等图像操作后,大量小物体由于像素占比低,在压缩过程中信息丢失明显,无法在识别过程中被检出。
其次是识别速度问题,对于一些支持高分辨率图像识别的算法如faster rcnn等,高分辨率图像的识别过程中会产生大量的物体识别框用于判断物体的类别,然后传统算法无法高效利用发挥现代GPU的并行处理能力,在实际应用中,其识别速度无法令人接受;同时不同算法若想利用GPU并行化加速训练需要单独优化现有的算法,开发难度大。
第三是GPU显存溢出的问题,高分辨率图像在物体识别过程中,产生的featuremap占用显存的空间非常大,对于普通的GPU显存来说,处理高分辨率图片经常会出现显存溢出的问题,无法很好的应用。
由于识别速度,识别精度以及识别所需要的显存占用问题,导致视频流中高分辨率图像的物体识别在漏检率,识别速度,显存管理等方面存在很大的限制,对于实际应用带来很大的挑战。现有技术主要通过以下方式解决:
一种简单的处理技术通过固定网格对每帧的图像进行切分,把高清图像切分为更小的图像,对更小的图像进行单独识别。但是由于不同图像中物体尺寸各不相同,固定的切分方法无法适应不同图像中物体大小不一的情况,会造成部分较大物体的丢失;同时若图像切分过小,也会增加GPU的计算量。
另一种处理技术首先通过对原始图像进行识别,然后对图像进行固定的网格切分,对与原始图像中识别到的物体且与物体出现在某些网格中,认为这些网格可能存在物体,从原图提取这些网格进行单独识别,丢弃其他网格。这个方法的问题在于,原图中位于视线远处的较小物体容易在原图识别中被丢失,这导致小物体将无法在图片切分中被检测出。
发明内容
本发明实施例的目的是提供一种自适应层级的图像切分识别方法、装置及系统,以解决现有对高清图像中物体识别存在的速度慢,检出率低的问题,该方法与可以与现有任何的图像识别技术结合,利用多GPU并行能力进行识别加速。
为了达到上述目的,本发明实施例所采用的技术方案如下:
第一方面,本发明实施例提供一种自适应层级的图像切分识别方法,包括:
获取图像步骤,用于获取高清视频中某一帧的原始图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010817355.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序