[发明专利]物体识别追踪方法在审
申请号: | 201710260693.1 | 申请日: | 2017-04-20 |
公开(公告)号: | CN107092883A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 张飞云 | 申请(专利权)人: | 上海极链网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海海贝律师事务所31301 | 代理人: | 范海燕 |
地址: | 202150 上海市崇明县*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 识别 追踪 方法 | ||
1.一种物体识别追踪方法,其特征在于:
1)对输入视频预处理;
处理步骤为视频解码,视频图像化,图像归一化;
2)利用神经网络对视频图片进行检测识别;
步骤一:输入图像;
由1)中采集的图像送入步骤二;
步骤二:检测目标区域;
步骤一中的图像会经过提取候选框,即目标区域的网络,提取感兴趣的区域;
步骤三:识别物体类别;
本步骤对步骤二中的候选框的内容进行识别分类;采用改进的ZF网络,使用适合网络大小的图片作为输入,网络的每一层是一个大小为w×h×d的三维矩阵,其中h和w代表图像的高度和宽度,d是滤波器的个数或者信道维数,利用上述三维矩阵得出网络每一层的神经单元个数;网络的输入为w×h×d维;网络每一层的输出计算公式为:
其中:
ho为输出图像高度,hi为输入图像高度;
pad为填充大小,指定在每次输入的图像的每一边加上多少个像素;
kernel_size为卷积核大小;
stride为步长,指滤波器滤波时候的滑动步长,即指定每次间隔几个像素值进行滤波;
输出宽度wo采用同样的方法计算;
步骤四:计算神经网络特征,经过softmax分类器进行分类从而生成C个物体类别的概率;又由于每个候选框的位置在步骤一中就会给出,至此,识别以及定位结束;
3)通过物体跟踪模块跟踪;
识别出物体的图片帧输入到检测识别模块中,同时输入识别出的物体位置及类别信息,在这一帧就初始化跟踪器,并且在接下来的视频序列中对这个检测到的物体进行跟踪,直到发生跟踪丢失的情况或者发生了镜头切换,至此一个跟踪序列结束;
4)进行投票操作;
2)与3)中既有检测结果又有跟踪结果,那么就牵扯到融合,在融合之后,便得到了一个个物体识别序列,为了得到最终的识别结果,需要一个投票操作;经过了这个投票操作后,对于每一个序列均会得到一个统一的标注、一个统一的分数;至此经过对整个视频的扫描后,对这个视频内的物体信息分析完毕。
2.如权利要求1所述的物体识别追踪方法,其特征在于:
对输入视频预处理方法中,采用从输入视频中截取帧的方法获取图片,其中帧率为25FPS,然后对截图的图片进行归一化处理,实验中采用224×224像素大小。
3.如权利要求2所述的物体识别追踪方法,其特征在于:
通过物体跟踪模块跟踪过程中,同一帧的画面中同时跟踪多个目标,每检测识别一次需要150ms,并采用了加速方法,每隔十帧检测识别一次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极链网络科技有限公司,未经上海极链网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710260693.1/1.html,转载请声明来源钻瓜专利网。