[发明专利]目标跟踪方法、装置及电子设备在审
申请号: | 201710710392.4 | 申请日: | 2017-08-18 |
公开(公告)号: | CN107452025A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 陈志超;马骁;周剑 | 申请(专利权)人: | 成都通甲优博科技有限责任公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/231 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 苏胜 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 跟踪 方法 装置 电子设备 | ||
1.一种目标跟踪方法,其特征在于,所述方法包括:
获取视频的前一帧图像,标记出所述前一帧图像中的待跟踪目标的位置;
根据所述待跟踪目标的位置,利用预设的卷积神经网络获取第一特征图,其中,所述第一特征图为所述待跟踪目标的特征图;
根据所述视频的后一帧图像,利用预设的卷积神经网络获取第二特征图,其中,所述后一帧图像为所述视频中与前一帧图像连续的图像,所述第二特征图为所述后一帧图像的特征图;
将所述第一特征图和所述第二特征图进行图像通道连接,得到第三特征图,其中,所述第三特征图的图像通道数为所述第一特征图的图像通道数和所述第二特征图的图像通道数之和;
在所述第三特征图中,进行所述待跟踪目标的位置回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标。
2.如权利要求1所述的方法,其特征在于,所述根据所述待跟踪目标的位置,利用预设的卷积神经网络获取第一特征图的步骤之前,还包括:
利用监督式方法,对包含多个人脸图像的离线人脸数据集进行预训练,得到卷积神经网络;
对所述卷积神经网络进行微调,得到微调后的卷积神经网络。
3.如权利要求2所述的方法,其特征在于,所述对所述卷积神经网络进行微调,得到微调后的卷积神经网络的步骤,包括:
对所述视频中的每一帧图像进行人脸检测,得到训练数据;
在所述训练数据中,对搜索区域的位置点进行区分,生成正负两类训练样本;
以获得的正负训练样本作为输入,使用Siamese网络对预训练的卷积神经网络进行微调,得到微调后的卷积神经网络,其中,所述Siamese网络由结构相同且权值共享的两个卷积神经网络组成。
4.如权利要求2所述的方法,其特征在于,所述根据所述待跟踪目标的位置,利用预设的卷积神经网络获取第一特征图的步骤,包括:
利用微调后的卷积神经网络对所述待跟踪目标进行特征提取,得到第一特征图。
5.如权利要求2所述的方法,其特征在于,所述根据所述视频的后一帧图像,利用预设的卷积神经网络获取第二特征图的步骤,包括:
利用微调后的卷积神经网络对所述后一帧图像进行特征提取,得到第二特征图。
6.如权利要求1所述的方法,其特征在于,对所述第三特征图进行所述待跟踪目标的位置回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标的步骤,包括:
将所述第三特征图分成S×S个网格;
每个所述网格对所述待跟踪目标的位置进行预测回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标。
7.一种目标跟踪装置,其特征在于,所述装置包括:
第一图像获取模块,用于获取视频的前一帧图像,标记出所述前一帧图像中的待跟踪目标的位置;
第一特征图获取模块,用于根据所述待跟踪目标的位置,利用预设的卷积神经网络获取第一特征图,其中,所述第一特征图为所述待跟踪目标的特征图;
第二特征图获取模块,用于根据所述视频的后一帧图像,利用预设的卷积神经网络获取第二特征图,其中,所述后一帧图像为所述视频中与前一帧图像连续的图像,所述第二特征图为所述后一帧图像的特征图;
图像通道连接模块,用于将所述第一特征图和所述第二特征图进行图像通道连接,得到第三特征图,其中,所述第三特征图的图像通道数为所述第一特征图的图像通道数和所述第二特征图的图像通道数之和;
位置回归模块,用于在所述第三特征图中,进行所述待跟踪目标的位置回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
预训练模块,用于利用监督式方法,对包含多个人脸图像的离线人脸数据集进行预训练,得到卷积神经网络;
微调模块,用于对所述卷积神经网络进行微调,得到微调后的卷积神经网络。
9.如权利要求7所述的装置,其特征在于,所述位置回归模块包括:
特征图划分单元,用于将所述第三特征图分成S×S个网格;
位置回归单元,用于每个所述网格对所述待跟踪目标的位置进行预测回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标。
10.一种电子设备,其特征在于,所述电子设备包括:
存储器;
处理器;以及
目标跟踪装置,所述装置存储于所述存储器中并包括一个或多个由所述处理器执行的软件功能模组,其包括:
第一图像获取模块,用于获取视频的前一帧图像,标记出所述前一帧图像中的待跟踪目标的位置;
第一特征图获取模块,用于根据所述待跟踪目标的位置,利用预设的卷积神经网络获取第一特征图,其中,所述第一特征图为所述待跟踪目标的特征图;
第二特征图获取模块,用于根据所述视频的后一帧图像,利用预设的卷积神经网络获取第二特征图,其中,所述后一帧图像为所述视频中与前一帧图像连续的图像,所述第二特征图为所述后一帧图像的特征图;
图像通道连接模块,用于将所述第一特征图和所述第二特征图进行图像通道连接,得到第三特征图,其中,所述第三特征图的图像通道数为所述第一特征图的图像通道数和所述第二特征图的图像通道数之和;
位置回归模块,用于在所述第三特征图中,进行所述待跟踪目标的位置回归,得到所述待跟踪目标在所述后一帧图像中的位置坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都通甲优博科技有限责任公司,未经成都通甲优博科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710710392.4/1.html,转载请声明来源钻瓜专利网。