[发明专利]一种获取视频中人群空间位置的方法有效
申请号: | 201911118462.2 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110909647B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 侯静轩;龙瀛;陈龙 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 视频 人群 空间 位置 方法 | ||
1.一种获取视频中人群空间位置的方法,其特征在于,包括以下步骤:
1)获取待分析空间视频;
获取反映待分析空间中人群活动的待分析空间视频,对所述视频有以下要求:无镜头失真、拍摄视角固定、视频能够覆盖完整的空间、视频中在待分析空间中活动的人为完整图像且视频中需要被识别的人大于2像素;视频长度不小于15分钟;
2)从步骤1)获取的视频中提取图像;
按照设定的帧数间隔从步骤1)获取的视频中提取图像;所述帧数间隔计算表达式如下:
TI=GW/AS*FN
其中,TI为帧数间隔;GW为待分析空间对应的平面图或俯视图中分析网格的边长,AS为人平均运动速度,FN为视频拍摄帧率;
3)利用卷积神经网络模型对步骤2)得到的每张图像进行目标检测;
利用ssd_resnet_50_fpn作为目标检测的卷积神经网络模型,所述模型的输入是步骤2)得到的每张图像,模型的输出包括:输入图像对应的识别范围,该图像中每个识别范围的置信度,每个识别范围中目标的类别以及该图像对应的帧数序号;其中每个识别范围对应一个目标识别框,每个识别范围包含四个数值,分别代表在输入图像目标识别平面直角坐标系下该识别范围对应的目标识别框的左下角X坐标、左下角Y坐标、右上角X坐标和右上角Y坐标,记为(Xa,Ya,Xc,Yc),每个坐标值取值范围均为0至1;其中,所述目标识别平面直角坐标系的原点为图像左上角顶点,X轴从上至下取值范围为0到1,Y轴从左至右取值范围为0到1;
4)利用几何算法将每张图像中人的位置还原为平面图或俯视图中的坐标,得到步骤1)获取的视频中人群空间位置信息;具体步骤如下:
4-1)利用步骤3)的结果,对每张图像,保留卷积神经网络模型输出中目标类别为1的目标识别框,其中1代表行人;
4-2)获取待分析空间的平面图或俯视图,在平面图或俯视图中,建立待分析空间最小包络正方形,该正方形的四个顶点分别记为左下角顶点PA、右下角顶点PB、右上角顶点PC和左上角顶点PD;采用平面图或俯视图的分析网格平面直角坐标系分别标记PA、PB、PC和PD的X、Y坐标;其中,所述平面图或俯视图的分析网格平面直角坐标系原点为该平面图或俯视图中最小包络正方形左下角顶点PA,水平从左到右为X轴正方向、垂直从下到上为Y轴正方向;
4-3)任意选取一张步骤2)中获取的图像,在该图像中标记步骤4-2)中得到待分析空间最小包络正方形在该图像中对应的四边形的四个顶点,分别记为左下角顶点A、右下角顶点B、右上角顶点C和右上角顶点D,并获取A、B、C、D在以该图像左下角作为坐标原点、水平从左到右为X轴正方向、垂直从下到上为Y轴正方向的该图像分析网格平面直角坐标系中X、Y坐标;
4-4)使用几何算法按照待分析空间的真实面积将步骤2)得到的每张图像中的待分析空间划分为4n个分析网格;获取该图像中每个分析网格的四个顶点在图像分析网格平面直角坐标系中的坐标;
其中,n的计算表达式如下:
n=|(L/GW)^0.25|-1
式中,L为每张图像中待分析空间最小包络正方形的边长;
4-5)对步骤2)获取的每张图像,计算经过步骤4-1)保留的每个识别框中底边中点在该图像目标识别平面直角坐标系中的坐标,并将该坐标转换为图像分析网格平面直角坐标系对应的坐标;
其中,目标识别平面直角坐标系中目标识别框底边中点坐标为:
[Xc,(Ya+Yc)/2]
转换后,图像分析网格平面直角坐标系中目标识别框底边中点坐标为:
[(Ya+Yc)/2,1-Xc]
4-6)统计所有图像中每个识别框底边中点在各个分析网格中出现的次数,得到每个分析网格对应的统计结果;
4-7)在平面图或俯视图分析网格平面直角坐标系中,根据PA、PB、PC和PD的X、Y坐标,使用几何算法将平面图或俯视图中的最小包络正方形化分为4n个分析网格;
4-8)将步骤4-6)得到的每个分析网格对应的统计结果赋值到步骤4-7)得到的平面图或俯视图中的4n个分析网格中;
4-9)按照各分析网格中底边中点数量从低到高的顺序利用从浅到深的颜色分别对步骤4-4)和步骤4-8)获得的分析网格进行填色,得到视频中人群空间位置的可视化结果;
步骤4-6)获得的统计结果和步骤4-9)获得的可视化结果即为从视频中获取的人群空间位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911118462.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种扭剪仪剪切位移测量系统
- 下一篇:一种容器镜像的替换方法