[发明专利]一种视频处理方法和装置有效
申请号: | 202010651511.5 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111881777B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 贾晨;刘岩;李驰;杨颜如 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/74;G06V10/82;G06N3/0464 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 处理 方法 装置 | ||
本发明公开了视频处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括获取实时视频采集数据,提取行人检测视频图像,进而构造行人检测数据集;根据所述行人检测数据集,通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框,以基于所述预测的行人检测框构造重识别数据集;基于Detnet特征提取网络的余弦距离度量模型,计算所述重识别数据集中任一行人检测框与其它行人检测框之间的余弦距离,得到余弦距离最近的TopN个行人检测框并返回。从而,本发明的实施方式能够解决现有在行人检测精准性差的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种视频处理方法和装置。
背景技术
目标检测技术的发展使得交通、楼宇监控等场景中的行人检测成为可能,在安防科技、智慧城市等领域具有非常重要的作用。在监控视频中,若能有效地突出特定的行人目标并进行检测、追踪,从而获得此行人在实时场景中的轨迹,就可以大幅度减少人工核查的成本,提高复杂场景中视频监控的效率。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
目前的行人检测算法通常都直接采用预先训练好的用于图像分类的模型权重进行训练并微调,而专门用于目标检测的特征提取器没有,且行人定位精准性差。
发明内容
有鉴于此,本发明实施例提供一种视频处理方法和装置,能够解决现有在行人检测精准性差的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种视频处理方法,包括获取实时视频采集数据,提取行人检测视频图像,进而构造行人检测数据集;根据所述行人检测数据集,通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框,以基于所述预测的行人检测框构造重识别数据集;基于Detnet特征提取网络的余弦距离度量模型,计算所述重识别数据集中任一行人检测框与其它行人检测框之间的余弦距离,得到余弦距离最近的TopN个行人检测框并返回。
可选地,提取行人检测视频图像,进而构造行人检测数据集,包括:
将实时视频采集数据进行视频分段,提取高峰期或中高峰期的行人检测视频流,以获得行人检测视频流中的关键帧图像;
将所述关键帧图像转换成预设尺寸的图像,构造行人检测数据集。
可选地,还包括:
所述Detnet特征提取网络构建的YOLO模型采用YOLO-V3模型结构,并将YOLO-V3模型结构中的主干特征提取网络设置为Detnet-59。
可选地,通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框,包括:
步骤一:经过64维卷积核为7x7、步长为2的空洞卷积后,输出208x208大小的图像;
步骤二:经过3组核为3x3的最大池化、64维核为1x1的卷积、64维核为3x3、步长为1的空洞卷积、256维核为1x2的卷积后,输出104x104大小的图像;
步骤三:经过4组128维核为1x1的卷积、128维核为3x3、步长为2的空洞卷积、512维核为1x2的卷积后,输出52x52大小的图像;
步骤四:经过6组256维核为1x1的卷积、256维核为3x3、步长为2的空洞卷积、1024维核为1x2的卷积后,输出52x52大小的图像;
步骤五:经过3组256维核为1x1的卷积、256维核为3x3、步长为1的2个空洞卷积、256维核为1x2的卷积后,输出52x52大小的图像;
步骤六:经过3组256维核为1x1的卷积、256维核为3x3、步长为1的2个空洞卷积、256维核为1x2的卷积后,输出52x52大小的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010651511.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应急救援智能车联网系统
- 下一篇:一种实现自动对话的方法和装置