[发明专利]对象追踪方法和装置有效
申请号: | 201610648861.X | 申请日: | 2016-08-09 |
公开(公告)号: | CN106326837B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 张弛;吴家楠;印奇 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象追踪 图像 方法和装置 检测位置 预测位置 视频 神经网络 图像预测 信息追踪 反馈式 计算量 帧图像 检测 预测 | ||
1.一种对象追踪方法,包括:
获取视频;
针对所述视频的至少部分帧的图像中的每帧图像,利用反馈式神经网络检测该图像中包含的对象在该图像中的检测位置信息、并预测该图像中包含的对象在所述至少部分帧的图像中的其他图像中的预测位置信息;以及
根据所述视频中包含的对象的检测位置信息和预测位置信息追踪对象;
其中,所述针对所述视频的至少部分帧的图像中的每帧图像,利用反馈式神经网络检测该图像中包含的对象在该图像中的检测位置信息、并预测该图像中包含的对象在所述至少部分帧的图像中的其他图像中的预测位置信息包括:
将所述至少部分帧的图像中的每帧图像输入卷积神经网络,以获得所述至少部分帧的图像中的每帧图像的第一特征;
将所述至少部分帧的图像中的每帧图像的第一特征输入所述反馈式神经网络,以获得所述至少部分帧的图像中的每帧图像的第二特征,其中,当前图像的第二特征与在所述当前图像之前的先前图像和在所述当前图像之后的随后图像相关,并且其中所述第二特征包括横向坐标向量、纵向坐标向量和频道向量;以及
基于所述至少部分帧的图像中的、任一图像的第二特征的横向坐标向量和纵向坐标向量确定在该图像中包含的对象在该图像中的检测位置信息,并预测该图像中包含的对象在所述至少部分帧的图像中的其他图像中的预测位置信息。
2.根据权利要求1所述的对象追踪方法,其中,所述基于所述至少部分帧的图像中的、任一图像的第二特征的横向坐标向量和纵向坐标向量确定在该图像中包含的对象在该图像中的检测位置信息,并预测该图像中包含的对象在所述至少部分帧的图像中的其他图像中的预测位置信息包括:
针对所述至少部分帧的图像中的任一图像,
对于每个由该图像的第二特征中的横向坐标和纵向坐标所代表的图像点,提取与该图像点相关的一个或多个初始区域;
利用第一分类器确定针对该图像提取的所有初始区域中的每一个包含对象的可能性;
从所述针对该图像提取的所有初始区域中选择可能性最高的一个或多个初始区域以获得一个或多个选定区域,其中,所述一个或多个选定区域中的每一个的特征由该图像的第二特征中的与该选定区域相对应的元素而定;以及
对于所述一个或多个选定区域中的每一个,将该选定区域的特征输入回归器,以获得该选定区域中包含的对象在该图像中的检测位置信息、在该图像之前的特定数目的先前图像中的预测位置信息、以及在该图像之后的特定数目的随后图像中的预测位置信息。
3.如权利要求2所述的对象追踪方法,其中,在所述针对所述至少部分帧的图像中的任一图像,从所述针对该图像提取的所有初始区域中选择可能性最高的一个或多个初始区域以获得一个或多个选定区域之后,所述对象追踪方法进一步包括:
针对所述至少部分帧的图像中的任一图像,对于所述一个或多个选定区域中的每一个,将该选定区域的特征输入第二分类器,以确定该选定区域中包含的对象是否是目标对象。
4.如权利要求2所述的对象追踪方法,其中,所述针对所述至少部分帧的图像中的任一图像,利用第一分类器确定针对该图像提取的所有初始区域中的每一个包含对象的可能性包括:
针对所述至少部分帧的图像中的任一图像,将所述针对该图像提取的所有初始区域中的每一个的特征中的频道向量输入所述第一分类器,以确定该初始区域中包含对象的可能性,
其中,所述针对该图像提取的所有初始区域中的每一个的特征由该图像的第二特征中的与该初始区域相对应的元素而定。
5.如权利要求2所述的对象追踪方法,其中,所述针对所述至少部分帧的图像中的任一图像,从所述针对该图像提取的所有初始区域中选择可能性最高的一个或多个初始区域以获得一个或多个选定区域包括:
针对所述至少部分帧的图像中的任一图像,
当从所述针对该图像提取的所有初始区域中选择的可能性最高的初始区域的个数为一个时,将该选择的初始区域确定为选定区域;
当从所述针对该图像提取的所有初始区域中选择的可能性最高的初始区域的个数为多个时,针对该图像合并所述可能性最高的多个初始区域中的重叠部分超过预定标准的两个或多于两个初始区域,以获得所述一个或多个选定区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610648861.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序