[发明专利]一种视频处理方法和装置有效
申请号: | 202010651511.5 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111881777B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 贾晨;刘岩;李驰;杨颜如 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/74;G06V10/82;G06N3/0464 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 处理 方法 装置 | ||
1.一种视频处理方法,其特征在于,包括:
获取实时视频采集数据,提取行人检测视频图像,进而构造行人检测数据集;
根据所述行人检测数据集,通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框,以基于所述预测的行人检测框构造重识别数据集;其中,所述Detnet特征提取网络构建的YOLO模型采用YOLO-V3模型结构,并将YOLO-V3模型结构中的主干特征提取网络设置为Detnet-59;
基于Detnet特征提取网络的余弦距离度量模型,计算所述重识别数据集中任一行人检测框与其它行人检测框之间的余弦距离,得到余弦距离最近的TopN个行人检测框并返回;
通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框之前,包括:
训练Detnet特征提取网络构建的YOLO模型和基于Detnet特征提取网络的余弦距离度量模型;其中,在训练过程中先固定ReID参数,训练Detnet和YOLO参数;然后固定YOLO参数,训练Detnet和ReID参数,直到通过预设目标损失函数得到的Detnet特征提取网络构建的YOLO模型和基于Detnet特征提取网络的余弦距离度量模型的损失值不再下降为止。
2.根据权利要求1所述的方法,其特征在于,提取行人检测视频图像,进而构造行人检测数据集,包括:
将实时视频采集数据进行视频分段,提取高峰期或中高峰期的行人检测视频流,以获得行人检测视频流中的关键帧图像;
将所述关键帧图像转换成预设尺寸的图像,构造行人检测数据集。
3.根据权利要求1所述的方法,其特征在于,通过Detnet特征提取网络构建的YOLO模型计算得到预测的行人检测框,包括:
步骤一:经过64维卷积核为7x7、步长为2的空洞卷积后,输出208x208大小的图像;
步骤二:经过3组核为3x3的最大池化、64维核为1x1的卷积、64维核为3x3、步长为1的空洞卷积、256维核为1x2的卷积后,输出104x104大小的图像;
步骤三:经过4组128维核为1x1的卷积、128维核为3x3、步长为2的空洞卷积、512维核为1x2的卷积后,输出52x52大小的图像;
步骤四:经过6组256维核为1x1的卷积、256维核为3x3、步长为2的空洞卷积、1024维核为1x2的卷积后,输出52x52大小的图像;
步骤五:经过3组256维核为1x1的卷积、256维核为3x3、步长为1的2个空洞卷积、256维核为1x2的卷积后,输出52x52大小的图像;
步骤六:经过3组256维核为1x1的卷积、256维核为3x3、步长为1的2个空洞卷积、256维核为1x2的卷积后,输出52x52大小的图像;
步骤七:经过1组卷积集、核为3x3的卷积、核为1x1的卷积后输出第一级预测的行人检测框;其中,所述1组卷积集包括核为1x1的卷积、核为3x3的卷积、核为1x1的卷积、核为3x3的卷积、核为1x1的卷积;
步骤八:将步骤七输出第一级预测的行人检测框经过核为1x1的卷积、上采样操作,与步骤五的输出相连,再经过1组卷积集、核为3x3的卷积、核为1x1的卷积后输出第二级预测的行人检测框;
步骤九:将步骤八输出第二级预测的行人检测框经过核为1x1的卷积、上采样操作,与步骤四的输出相连,再经过1组卷积集、核为3x3的卷积、核为1x1的卷积后输出第三级预测的行人检测框。
4.根据权利要求1所述的方法,其特征在于,基于所述预测的行人检测框构造重识别数据集,包括:
根据预测的行人检测框对相应的原视频图像裁剪得到目标行人图像,并在线将所述目标行人图像按照类别进行划分;
将划分后的目标行人图像基于Market1501数据集的格式进行处理,以生成重识别数据集并存储至文件夹中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010651511.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应急救援智能车联网系统
- 下一篇:一种实现自动对话的方法和装置