[发明专利]基于多帧图片的目标检测方法、装置及存储介质在审
申请号: | 202010951616.2 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112070036A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 张林萌;曹侃 | 申请(专利权)人: | 联通物联网有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 梁瑜;刘芳 |
地址: | 210006 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 目标 检测 方法 装置 存储 介质 | ||
本发明实施例提供一种基于多帧图片的目标检测方法、装置及存储介质,通过获取待处理的多帧图片;对多帧图片中的第一帧图片进行目标检测,确定目标检测区域,根据目标检测区域,依次对多帧图片中剩余图片通过CGDBSCAN算法进行目标检测,并根据剩余图片中每帧图片对应的目标检测结果,依次对目标检测区域进行更新,直至剩余图片的最后一帧图片完成目标检测;输出多帧图片对应的检测目标,由于通过第一帧图片的检测结果作为参考对后续图片进行目标检测,而不用从每张图片的起始位置开始检测,可以有效降低计算量,同时提高目标识别的效率,使目标检测过程中的准确度与实时性得到兼顾。
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于多帧图片的目标检测方法、装置及存储介质。
背景技术
近几年随着移动互联网、大数据、人工智能等技术的发展和应用社会立体化治安防控体系建设项目的逐期落成,计算机视觉在其中所体现的价值和承担的任务越来越大。深度学习在计算机视觉领域的快速发展,让计算机视觉领域成为了近几年的研究和应用热点。
计算机视觉领域的物体跟踪任务,其基本作用是在指定了目标物体后,让机器能够从图片中自动识别目标物体的大小和位置,并给出其在后续图片序列的图片中出现的位置。现有技术中,通常采用复杂卷积神经网络或大型AI算法,来实现多帧图片中的目标检测。
然而,虽然复杂卷积神经网络或大型AI算法实现多帧图片中的物体跟踪的辨识精度较高,但计算分析耗时较长,效率较低,无法兼顾准确度与实时性。
发明内容
本发明提供一种基于多帧图片的目标检测方法、装置及存储介质,用以解决对多帧图片进行目标检测时计算分析耗时较长,效率较低,无法兼顾准确度与实时性问题。
根据本公开实施例的第一方面,本发明提供了一种基于多帧图片的目标检测方法,所述方法包括:
获取待处理的多帧图片;
对所述多帧图片中的第一帧图片进行目标检测,确定目标检测区域,所述目标检测区域内包括检测目标;
根据所述目标检测区域,依次对所述多帧图片中剩余图片通过基于网格和贡献度的改进对噪声鲁棒的空间聚类算法(Grid Contribution Density Based SpatialClustering of Applications with Noise,CGDBSCAN)进行目标检测,并根据所述剩余图片中每帧图片对应的目标检测结果,依次对目标检测区域进行更新,直至所述剩余图片的最后一帧图片完成目标检测;
输出所述多帧图片对应的检测目标。
在一种可能的实现方式中,根据所述目标检测区域,依次对所述多帧图片中剩余图片通过CGDBSCAN算法进行目标检测,包括:
获取预设的图片序列;
按照所述图片序列,读取所述剩余图片中的多个图片组,其中,所述图片组中包括预设帧数的图片;
根据所述目标检测区域,通过CGDBSCAN算法对各所述图片组中的各帧所述图片进行目标检测。
在一种可能的实现方式中,根据所述目标检测区域,通过CGDBSCAN算法对各所述图片组中的各帧所述图片进行目标检测,包括:
获取所述目标检测区域的中心点位置;
以中心点位置为中心,构建多个检测区域逐渐扩大的待检测区域;
从检测区域最小的待检测区域开始,依次通过CGDBSCAN算法对各所述图片组中的各帧所述图片进行目标检测,直至检测到所述检测目标。
在一种可能的实现方式中,依次通过CGDBSCAN算法对各所述图片组中的各帧所述图片进行目标检测,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联通物联网有限责任公司,未经联通物联网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010951616.2/2.html,转载请声明来源钻瓜专利网。