[发明专利]视频目标检测方法、装置及图像处理设备有效
申请号: | 201811527109.5 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109635740B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 姜浩;曲晓超;杨思远;张伟;万鹏飞 | 申请(专利权)人: | 深圳美图创新科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 逯恒 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 目标 检测 方法 装置 图像 处理 设备 | ||
本申请实施例提供一种视频目标检测方法、装置及图像处理设备,该设备中预存有MaskRCNN网络,其中包括CNN模型、RPN、检测分支及嵌入分支。图像处理设备针对待检测视频的当前图像帧,将当前图像帧输入CNN模型,得到第一特征图;将第一特征图输入RPN,获得多个候选区域,该候选区域为包括待检测目标的区域;针对获得的每个候选区域,嵌入分支生成与该候选区域对应的第一向量,在存储的嵌入列表中查找是否存在与该第一向量相似的第二向量,若是,对该第一向量进行更新;检测分支以更新后的该第一向量为时序信息对该候选区域的位置进行预测。
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种视频目标检测方法、装置及图像处理设备。
背景技术
物体检测作为计算机视觉中的经典研究领域已经有了多年的发展,但截至目前为止,大部分研究都集中在静态图像中的物体检测上。对视频图像中的物体检测研究相对较少。
目前,对视频图像中的物体检测的研究主要集中于通过如下两种方式在网络中加入时序信息:第一、利用光流将上一帧的检测结果warp(仿射变换模及扭曲)到当前网络中,作为RGB通道之外的第四通道输入;第二、在做非极大值抑制(Non-Maximum Suppression,NMS)时考虑前几帧图像的候选区域。
然而,上述两种方式在实际应用中存在不稳定的情况。
发明内容
有鉴于此,本申请的目的在于提供一种视频目标检测方法、装置及图像处理设备,以至少部分地改善上述问题。
第一方面,本申请实施例提供一种视频目标检测方法,应用于图像处理设备,所述图像处理设备中预存有用于进行视频目标检测的MaskRCNN网络,所述MaskRCNN网络包括CNN模型、区域建议网络RPN、检测分支以及Embedding嵌入分支;所述方法包括:
针对待检测视频的当前图像帧,将所述当前图像帧输入所述CNN模型,得到第一特征图;
将所述第一特征图输入所述RPN,获得多个候选区域,所述候选区域为包括待检测目标的区域;
针对获得的每个所述候选区域,所述嵌入分支生成与所述候选区域对应的第一向量,在存储的嵌入列表中查找是否存在与所述第一向量相似的第二向量,若存在,则对所述第一向量进行更新;
所述检测分支以更新后的所述第一向量为时序信息对所述候选区域的位置进行预测。
可选地,所述方法还包括:
若所述嵌入列表中不存在与所述第一向量相似的第二向量,则将所述第一向量作为第二向量插入到所述嵌入列表中。
可选地,对所述第一向量进行更新,包括:
通过以下计算式对所述第一向量Vt进行更新:
Vt=γVt+(1-γ)x
其中,γ表示权重,x表示所述当前图像帧的前一图像帧中的候选区域的第一向量。
可选地,所述方法还包括:
通过以下计算式对所述嵌入分支的损失进行计算,并根据计算结果对所述嵌入分支的参数进行调整:
其中,表示当前图像帧中第i个被检测的候选区域,表示所述嵌入列表中与该第i个被检测的候选区域对应的第二向量,为所述嵌入列表中任意一个不同于该第二向量的其他第二向量,α表示最小间隔,表示当前图像帧中第i个被检测的候选区域所对应的特征表达,表示所述嵌入列表中与该第i个被检测的候选区域对应的第二向量所对应的特征表达,表示所述嵌入列表中任意一个不同于该第二向量的其他第二向量所对应的特征表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳美图创新科技有限公司,未经深圳美图创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811527109.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虹膜采集方法和设备
- 下一篇:一种人脸识别大数据管理系统