[发明专利]基于改进型SSD网络的行人目标检测与重识别方法有效
申请号: | 202110488919.X | 申请日: | 2021-05-06 |
公开(公告)号: | CN112906677B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 刘茜;蒋昱 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 熊玉玮 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进型 ssd 网络 行人 目标 检测 识别 方法 | ||
1.基于改进型SSD网络的行人目标检测与重识别方法,利用获得的目标检测与重识别系统,对目标场景下的各个待识别视频进行目标检测与重识别,其特征在于,构建两个目标场景下历史时间周期内的两个视频数据集、对应的两个改进型SSD网络,所述两个视频数据集包括第一视频数据集、第二视频数据集,视频数据集对应的改进型SSD网络包括第一网络、第二网络,执行以下步骤:
步骤A、针对两个目标场景下历史时间周期内的两个视频集,对视频集中的各个视频转换为有效视频帧图像序列,并对序列中的每一幅图像进行标注处理,构成每个视频集对应的视频数据集,所述视频数据集包括训练集和验证集,随后进入步骤B;
步骤B、分别针对两个视频数据集,构建与视频数据集对应的SSD网络,获得改进型SSD网络,即获得两个视频数据集分别对应的改进型SSD网络,随后进入步骤C;
步骤C、分别针对两个改进型SSD网络,利用对应视频数据集中的有效视频帧图像对该改进型SSD网络进行训练,训练好的两个改进型SSD网络构成目标检测与重识别系统;
步骤D、针对各个待识别视频,基于目标检测与重识别系统,以待识别视频的有效视频帧图像为输入,以待识别视频内行人预测结果、待识别视频对应的视频帧图像位置标注为输出,获得行人的目标检测与重识别结果;
所述步骤B中的改进型SSD网络包括基础网络层、多尺度网络层、定位子网络、行人部件识别子网络、行人重识别子网络、非极大值抑制模块、预测结果融合模块,构建与视频数据集对应的改进型SSD网络,获得改进型SSD网络,包括以下步骤:
步骤B1、更换SSD网络基础网络层中的五个卷积模块,更换后基础网络层的结构依次为:输入层、第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块、第五卷积模块,并将原基础网络层中五个卷积模块的输出,分别更换为对应的第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块、第五卷积模块的输出;
步骤B2、更换SSD网络中多尺度网络层中的卷积模块,对第四卷积模块的输出进行归一化操作,作为多尺度网络层第一尺度的输出,将多尺度网络层中的最后四个卷积模块更换为四个残差模块,并相应将最后四个卷积模块的输出分别更换为对应的残差模块的输出,对残差模块的输出、未更换的卷积模块中每一个卷积层的输出进行归一化操作;
步骤B3、将SSD网络中的目标检测模块设置为定位子网络,用于生成预测边界框;
将识别模块设置为行人部件识别子网络,用于识别预测边界框标识区域的行人部件类别;
在SSD网络中增加一个与定位子网络和行人部件识别子网络并行的,用于识别预测边界框标识区域内行人类别的行人重识别子网络,预测边界框的生成与行人部件识别、行人重识别同时进行,所述行人重识别子网络包括,根据步骤A中预处理后的视频帧图像标注的行人类别划分的共有识别模块、独有识别模块;
所述共有识别模块,用于对两个视频集中共有的行人类别进行识别,所述独有识别模块,用于对只存在于其中一个视频集中的行人类别进行识别;
对所述定位子网络、所述行人部件识别子网络、所述行人重识别子网络中的每一个卷积层的输出进行归一化操作;
步骤B4、通过标签平滑正则化方法优化行人部件类别和行人类别的概率分布;
步骤B5、更换SSD网络中误差函数的识别误差值,将识别误差值由一组标记的分类误差更换为行人部件类别识别误差值与行人类别识别误差值之和,在所有有效视频帧图像通过非极大值抑制模块完成非极大值抑制后,通过预测结果融合模块,将同一个行人的整体和部件的位置、大小、相应的类别信息进行筛选融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110488919.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:净水器
- 下一篇:人机对抗知识数据混合驱动型决策方法、装置及电子设备