[发明专利]一种基于机器视觉的地铁公共地点人流量分析方法有效
申请号: | 201910702656.0 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110490099B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 孟小亮;王才群;陈志伊;魏冕;杨一鸣;王晓悦 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/82 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 刘琰 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 视觉 地铁 公共 地点 人流量 分析 方法 | ||
本发明公开了一种基于机器视觉的地铁公共地点人流量分析方法,包括以:S1、获取地铁摄像头拍摄的历史视频流数据,提取地铁人流训练数据集;S2、加载YOLOv3网络的预训练模型,初始化网络权重;S3、将INRIA行人数据集与地铁人流数据训练集输入YOLOv3网络进行训练,得到真实目标框标注;S4、增加N次上采样操作,获得N个更小尺度的特征图,改变输入图像的大小;S5、对混合后的数据集进行网络粗训练,优化目标框的个数和宽高;S6、对地铁人流训练数据集进行网络精训练;S7、利用训练后的网络模型对地铁人流测试数据集进行检测,统计人流量;并评价网络模型的性能。本发明检测精度高,由粗到精的策略训练网络,优化了边界框参数,控制了检测速度与精度的平衡。
技术领域
本发明涉及目标检测领域,尤其涉及一种基于机器视觉的地铁公共地点人流量分析方法。
背景技术
人流量是商场、地铁站等公共地点安全管理和预警不可或缺的数据。传统的基于视频的目标检测,通过帧与帧之间图像信息的变化实现,相对静态目标检测,容易造成漏检。基于特征的方法,泛化能力差,且提取的往往是底层特征,无法表达高层语义特征。近年来,深度学习在机器视觉领域的研究成果被越来越多的应用到目标检测领域。其中又分为基于区域的方法和基于回归的方法。基于回归的方法解决检测速度与精度平衡的问题,其中YOLOv3借鉴了残差块、多尺度预测等其他网络成果,综合表现优秀,可满足实时处理的要求。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于机器视觉的地铁公共地点人流量分析方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于机器视觉的地铁公共地点人流量分析方法,该方法包括以下步骤:
S1、获取地铁摄像头拍摄的历史视频流数据,作为训练集,从中提取地铁人流训练数据集;
S2、加载YOLOv3网络的预训练模型,初始化网络权重;
S3、获取开源的INRIA行人数据集,将INRIA行人数据集与地铁人流数据训练集输入YOLOv3网络进行训练,得到真实目标框标注,并对其进行补充和再整理;
S4、增加N次上采样操作,获得N个更小尺度的特征图,扩大可监测目标的尺寸范围,并据此改变输入图像的大小;
S5、将INRIA行人数据集与地铁人流训练数据集混合,对混合后的数据集进行网络粗训练,优化目标框的个数和宽高;
S6、结合上述步骤得到的参数,对地铁人流训练数据集进行网络精训练,得到训练后的网络模型;
S7、输入待分析的地铁人流测试数据集,利用训练后的网络模型对地铁人流测试数据集进行检测,统计人流量;并评价网络模型的性能。
进一步地,本发明的步骤S1的具体方法为:
通过RTSP协议获取地铁摄像头的视频流数据,从视频流数据中每三帧取一帧作为待检测图像,组成地铁公共地点人流的静态图像数据集。
进一步地,本发明的步骤S3的具体方法为:
对每张输入图片,有txt文件存放图片上真实目标框的标注信息,对任一目标框,信息格式为:所属类别编号,归一化后的中心点x坐标,y坐标,归一化后的目标框宽度,目标框高度。对于没有标注信息或信息不完全不规范的图像,利用LabelImg工具进行人工补充标注和整理。
进一步地,本发明的步骤S4的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910702656.0/2.html,转载请声明来源钻瓜专利网。