[发明专利]特定对象的目标建议窗口生成方法及其在目标跟踪的应用有效
申请号: | 201810046395.7 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108257148B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 王菡子;郭冠军;梁艳杰;严严 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06T7/207 | 分类号: | G06T7/207;G06T7/215;G06T7/277 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特定 对象 目标 建议 窗口 生成 方法 及其 跟踪 应用 | ||
1.特定对象的目标建议窗口生成方法,其特征在于包括以下步骤:
1)给定一帧训练视频,将训练视频图像分成三个区域:完全的目标区域、完全的背景区域以及目标区域与背景区域的混合区域;
2)对步骤1)中所述完全的目标区域和完全的背景区域分别计算目标像素和背景像素的概率分布图,以学习率λ更新目标像素和背景像素的概率分布图模型;
3)给定一帧测试视频,利用训练好的概率分布图来预测图像中每个像素属于目标的概率,得到概率响应图;
4)对原图和概率响应图分别提取目标建议窗口,并将所述目标建议窗口都作为候选的目标建议窗口;
5)对步骤4)中得到的目标建议窗口基于与对象的相似度进行排序,生成特定对象的目标建议窗口;
6)将步骤5)中得到的特定对象的目标建议窗口作为MDNET的训练样本对CNN分类器进行训练,基于MDNET的框架实现目标跟踪。
2.如权利要求1所述特定对象的目标建议窗口生成方法,其特征在于在步骤1)中,所述将训练视频图像分成三个区域:完全的目标区域、完全的背景区域以及目标区域与背景区域的混合区域的具体划分方法如下:
目标区域与背景区域的混合区域是一个中间为孔洞的矩形框,该矩形框的高度/宽度是目标高度/宽度的γ倍,其中,矩形框位于目标和背景;完全的目标区域位于矩形框内部,完全的背景区域位于矩形框外部;所述γ=0.4。
3.如权利要求1所述特定对象的目标建议窗口生成方法,其特征在于在步骤2)中,所述对步骤1)中所述完全的目标区域和完全的背景区域分别计算目标像素和背景像素的概率分布图,以学习率λ更新目标像素和背景像素的概率分布图模型的具体方法如下:
记xf和xb分别表示完全目标区域F和完全背景区域B的像素;已知xf和xb,则xf和xb的概率分布pf和pb由xf和xb的直方图计算得到;概率分布pf和pb每隔k帧进行更新,更新方式如下:
其中,λ为学习率,m为视频帧索引;所述更新的策略能够保证当目标和背景的表观发生改变时,概率分布pf和pb能够得到较好地估算;所述目标和背景的颜色直方图区间设置为32。
4.如权利要求1所述特定对象的目标建议窗口生成方法,其特征在于在步骤3)中,所述给定一帧测试视频,利用训练好的概率分布图来预测图像中每个像素属于目标的概率,得到概率响应图的计算公式如下:
其中,ε为一个较小的常数,防止分式的分母为零;虽然概率响应图包含一些错误的预测,但是能够抑制大部分的噪声;在目标建议窗口生成过程中,概率响应图能够减缓运动模糊、弱对比度、嘈杂背景造成的弱边缘效应。
5.如权利要求1所述特定对象的目标建议窗口生成方法,其特征在于在步骤4)中,所述对原图和概率响应图分别提取目标建议窗口,并将所述目标建议窗口都作为候选的目标建议窗口是基于EdgeBoxes生成目标建议窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810046395.7/1.html,转载请声明来源钻瓜专利网。