[发明专利]一种单阶段半监督图像人体目标检测方法在审
申请号: | 202010114793.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111368660A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 陈学贤;吴斯 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 阶段 监督 图像 人体 目标 检测 方法 | ||
1.一种单阶段半监督图像人体目标检测方法,其特征在于,包括以下步骤:
S1、对视频帧数据进行划分,分有真实标签图像集合无真实标签图像集合和测试数据集合
S2、从无真实标签图像集合中获取一张无真实标签图像经过VGG16网络和RPN网络得到预测的位置坐标信息和相应的得分信息,将高置信度的位置坐标信息和得分信息送入到IoU网络,得到预测交并比信息,选取预测交并比大于或等于预定阈值的人体框预测信息作为该无真实标签图像的临时标签;
S3、输入两张图像到整个网络的入口,该整个网络是由VGG16、RPN和IoU三个网络组成,记为网络VGG16+RPN+IoU,其中一张为步骤S2的无真实标签图像另一张为从真实标签图像集合种获取的真实标签图像用于当前一轮的训练,用损失函数进行约束;
S4、重复步骤S2-S3,达到预先设定训练次数后完成训练;
S5、用测试数据集合对训练好的完整网络VGG16+RPN+IoU进行测试评估,得到人体目标检测的结果。
2.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S1中,需要对视频帧的图像进行缩放处理,以期达到理想的训练效果和减少数据运算量;根据需要对视频帧数据进行分类,先把视频帧数据分为训练数据和测试数据集合两类;再将训练数据分为两类:真实标签图像集合和无真实标签图像集合的比例为1:19,即训练数据等于一张真实标签图像记为即一张无真实标签图像记为即
3.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S2中,对无真实标签图像标注临时标签,对于整个网络模型VGG16+RPN+IoU,采取和测试阶段相同的模式,对参数进行固定,不进行更新;通过RPN网络获取分类信息和位置坐标信息,再选取高置信度的人体框通过IoU网络得到最后的IoU得分预测,选取IoU大于或等于预定阈值的人体框预测信息作为无真实标签图像的临时标签。
4.根据权利要求1所述的一种单阶段半监督图像人体目标检测方法,其特征在于:在步骤S3中,所述VGG16网络包含16个卷积层,分有5组;所述RPN网络包含一个3×3卷积核的卷积层和两个分别用来预测分类与位置坐标信息的卷积层,所述IoU网络包括三个全连接层对预测人体框进行拟合,具体的训练过程如下:
S31、输入包含真实标签图像和无真实标签图像的图片I;
S32、图片I经过第一组64个通道卷积层,得到特征图F1,经过最大化池化层得到特征图F1';
S33、将特征图F1'经过第二组128个通道卷积层,得到特征图F2,经过最大化池化层得到特征图F2';
S34、将特征图F2'经过第三组256个通道卷积层,得到特征图F3,经过最大化池化层得到特征图F3';
S35、将特征图F3'经过第四组512个通道卷积层,得到特征图F4,经过最大化池化层得到特征图F4';
S36、将特征图F4'经过第五组512个通道卷积层,得到特征图F5;
S37、将特征图F5经过RPN网络得到大小相同的特征图F5',然后通过分类和定位卷积层得到相应的输出C、B;其中,C为对应anchor预测的分类得分,B为对应anchor预测的人体框位置坐标信息;
S38、将步骤S37中得到的分类得分信息和位置坐标信息进行筛选,选取分类得分大于预定阈值的人体框作进一步的甄别;
S39、将步骤S38选取好的人体框在步骤S36中的特征图F5上挖取对应的特征图F;
S310、特征图F转换成向量f输入到IoU网络中,最后得到人体框对应的IoU预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010114793.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序