[发明专利]目标检测方法、装置及电子设备有效
申请号: | 202010052654.4 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111222509B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 王旭 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V20/40;G06V10/74;G06V10/82;G06N3/08 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 朱智勇 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 电子设备 | ||
1.一种目标检测方法,其特征在于,包括:
对目标视频中的第一视频帧执行目标检测,以获得一个或多个目标检测结果;
设置与所述目标检测结果相匹配的第一目标表示区域,所述第一目标表示区域的面积大于所述目标检测结果的实际面积;
利用预设的关键点模型和所述第一目标表示区域,对所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧进行关键点检测;
基于所述关键点检测的结果,确定所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧中存在的目标对象,所述关键点检测的结果为任一视频帧中存在的对象的形状,用于从所述存在的对象中筛选与目标对象形状相同的对象作为目标对象;
所述基于所述关键点检测的结果,确定所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧中存在的目标对象之后,所述方法还包括:
获取所述与所述第一视频帧相邻的多个相邻视频帧之后的第二视频帧中的视野;
判断所述第二视频帧中的视野与所述第一视频帧中的视野是否相同;
若否,则对所述第二视频帧重新开始执行目标检测。
2.根据权利要求1所述的方法,其特征在于,所述则对所述第二视频帧重新开始执行目标检测之后,所述方法还包括:
设置与所述第二视频帧的目标检测结果相匹配的第二目标表示区域,所述第二目标表示区域的面积大于所述第二视频帧目标检测结果的实际面积;
利用预设的关键点模型和所述第二目标表示区域,对所述第二视频帧以及与所述第二视频帧相邻的多个相邻视频帧进行关键点检测;
基于所述关键点检测的结果,确定所述第二视频帧以及与所述第二视频帧相邻的多个相邻视频帧中存在的目标对象。
3.根据权利要求1所述的方法,其特征在于,所述对目标视频中的第一视频帧执行目标检测,以获得一个或多个目标检测结果,包括:
利用预设的目标检测模型中包含的滑动窗口检测器,对所述第一视频帧中存在的对象进行检测,从而形成一个或多个目标检测结果。
4.根据权利要求3所述的方法,其特征在于,所述利用预设的目标检测模型中包含的滑动窗口检测器,对所述第一视频帧中存在的对象进行检测,包括:
获取已经通过训练样本对所述目标检测模型完成训练后的神经网络模型;
通过固定大小的窗口以及固定步长扫描所述第一视频帧,将所述第一视频帧中处于窗口中的图像送入训练好的卷积网络进行检测;
通过变换扫描窗口的大小,检测出有无物体以及物体的定位。
5.根据权利要求1所述的方法,其特征在于,所述设置与所述目标检测结果相匹配的第一目标表示区域,包括:
获取所述目标检测结果在所述第一视频帧上的实际区域;
以所述实际区域的中心为中心,在水平和垂直方向上分别进行预设倍数的扩展;
将扩展后的区域作为所述第一目标表示区域。
6.根据权利要求1所述的方法,其特征在于,所述利用预设的关键点模型和所述第一目标表示区域,对所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧进行关键点检测,包括:
获取所述目标表示区域内的图像;
基于关键点模型,对所述目标表示区域内的图像对象执行关键点检测,以得到关键点检测结果。
7.根据权利要求1所述的方法,其特征在于,所述基于所述关键点检测的结果,确定所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧中存在的目标对象,包括:
判断关键点检测的结果于预设的目标模型是否匹配;
若是,则将所述关键点检测的结果作为所述第一视频帧以及与所述第一视频帧相邻的多个相邻视频帧中存在的目标对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010052654.4/1.html,转载请声明来源钻瓜专利网。