[发明专利]物体识别追踪方法在审
申请号: | 201710260693.1 | 申请日: | 2017-04-20 |
公开(公告)号: | CN107092883A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 张飞云 | 申请(专利权)人: | 上海极链网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海海贝律师事务所31301 | 代理人: | 范海燕 |
地址: | 202150 上海市崇明县*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种物体识别追踪方法,提出一种消费级视频内物体识别及追踪的方法,该方法包含两个阶段,在第一阶段使用神经网络快速从视频中检测出物体的位置并识别出该物体类别,分割出物体区域送入第二阶段处理,第二阶段对物体进行跟踪;本发明提供的物体识别追踪方法,使用物体识别追踪系统从输入图像中快速准确地识别出该物体类别及对它定位跟踪;物体识别追踪系统的核心问题在于从输入视频中检测出物体的类别以及精确位置,然后进行跟踪。 | ||
搜索关键词: | 物体 识别 追踪 方法 | ||
【主权项】:
一种物体识别追踪方法,其特征在于:1)对输入视频预处理;处理步骤为视频解码,视频图像化,图像归一化;2)利用神经网络对视频图片进行检测识别;步骤一:输入图像;由1)中采集的图像送入步骤二;步骤二:检测目标区域;步骤一中的图像会经过提取候选框,即目标区域的网络,提取感兴趣的区域;步骤三:识别物体类别;本步骤对步骤二中的候选框的内容进行识别分类;采用改进的ZF网络,使用适合网络大小的图片作为输入,网络的每一层是一个大小为w×h×d的三维矩阵,其中h和w代表图像的高度和宽度,d是滤波器的个数或者信道维数,利用上述三维矩阵得出网络每一层的神经单元个数;网络的输入为w×h×d维;网络每一层的输出计算公式为:ho=hi+2*pad-kernel_sizestride+1]]>其中:ho为输出图像高度,hi为输入图像高度;pad为填充大小,指定在每次输入的图像的每一边加上多少个像素;kernel_size为卷积核大小;stride为步长,指滤波器滤波时候的滑动步长,即指定每次间隔几个像素值进行滤波;输出宽度wo采用同样的方法计算;wo=wi+2*pad-kernel_sizestride+1]]>步骤四:计算神经网络特征,经过softmax分类器进行分类从而生成C个物体类别的概率;又由于每个候选框的位置在步骤一中就会给出,至此,识别以及定位结束;3)通过物体跟踪模块跟踪;识别出物体的图片帧输入到检测识别模块中,同时输入识别出的物体位置及类别信息,在这一帧就初始化跟踪器,并且在接下来的视频序列中对这个检测到的物体进行跟踪,直到发生跟踪丢失的情况或者发生了镜头切换,至此一个跟踪序列结束;4)进行投票操作;2)与3)中既有检测结果又有跟踪结果,那么就牵扯到融合,在融合之后,便得到了一个个物体识别序列,为了得到最终的识别结果,需要一个投票操作;经过了这个投票操作后,对于每一个序列均会得到一个统一的标注、一个统一的分数;至此经过对整个视频的扫描后,对这个视频内的物体信息分析完毕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极链网络科技有限公司,未经上海极链网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710260693.1/,转载请声明来源钻瓜专利网。