[发明专利]视频目标的处理方法及装置有效
申请号: | 201910556593.2 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110287877B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 揭泽群;李宁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/25;G06V10/80 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李梅香;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 目标 处理 方法 装置 | ||
1.一种视频目标的处理方法,其特征在于,所述方法包括:
对从视频进行解码得到的当前帧图像、以及所述当前帧图像对应的前序帧图像进行目标检测;
分别确定在所述当前帧图像和所述前序帧图像中对应检测到的目标的包围框、以及所述包围框对应的置信度分数;
从所述当前帧图像开始遍历至所述前序帧图像,将相邻两帧图像中对应所述目标的包围框,根据空间位置重叠程度进行连接形成包围框管,得到由至少两个所述包围框管组成的包围框树;
确定所述包围框树中使所述目标的包围框的置信度分数之和最大的包围框管;
根据使所述目标的包围框的置信度分数之和最大的包围框管,更新所述当前帧图像中所述目标的包围框对应的置信度分数。
2.根据权利要求1所述的方法,其特征在于,所述将相邻两帧图像中对应所述目标的包围框,根据空间位置重叠程度进行连接形成包围框管,包括:
当相邻两帧图像中对应所述目标的包围框交并比大于交并比阈值时,将所述相邻两帧图像中对应所述目标的包围框进行连接形成包围框管。
3.根据权利要求1所述的方法,其特征在于,所述确定所述包围框树中使所述目标的包围框的置信度分数之和最大的包围框管,包括:
将所述包围框树划分为至少两个包围框子树;
针对每个所述包围框子树,从所述包围框子树的第一层开始遍历至最后一层,得到所述包围框子树中使所述目标的包围框的置信度分数之和最大的包围框子管;
将每个所述包围框子树对应的所述包围框子管进行整合,得到所述包围框树中使所述目标的包围框的置信度分数之和最大的包围框管。
4.根据权利要求3所述的方法,其特征在于,所述将所述包围框树划分为至少两个包围框子树,包括:
从所述包围框树中选取所述当前帧图像中的包围框、以及所述当前帧图像之前M个连续的前序帧图像中的包围框,并组成局部包围框树;
其中,M为正整数,所述M个前序帧图像的第一帧图像中所述目标的置信度分数为已更新的置信度分数;
将所述局部包围框树划分为至少两个包围框子树。
5.根据权利要求1所述的方法,其特征在于,所述确定所述包围框树中使所述目标的包围框的置信度分数之和最大的包围框管,包括:
当从所述当前帧图像中检测到至少两个所述目标时,针对每个所述目标,确定所述包围框树中满足以下条件的包围框管:
使所述目标的包围框的置信度分数之和最大;
使不同所述目标的包围框管互不重叠。
6.根据权利要求1所述的方法,其特征在于,所述根据使所述目标的包围框的置信度分数之和最大的包围框管,更新所述当前帧图像中所述目标的包围框对应的置信度分数,包括:
针对使所述目标的包围框的置信度分数之和最大的包围框管,确定所述包围框管中包围框的最高置信度分数和平均置信度分数;
将所述最高置信度分数和所述平均置信度分数的加权结果,确定为所述当前帧图像中所述目标的包围框更新的置信度分数。
7.根据权利要求1所述的方法,其特征在于,所述对从视频进行解码得到的当前帧图像、以及所述当前帧图像对应的前序帧图像进行目标检测,包括:
在所述当前帧图像以及所述前序帧图像中,分别利用不同尺寸的窗口进行滑动;
通过分类器对不同尺寸的窗口中的图像进行分类,得到所述图像中的像素点是否是所述目标的像素点的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910556593.2/1.html,转载请声明来源钻瓜专利网。