[发明专利]一种单阶段半监督图像人体目标检测方法在审
申请号: | 202010114793.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111368660A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 陈学贤;吴斯 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 阶段 监督 图像 人体 目标 检测 方法 | ||
本发明公开了一种单阶段半监督图像人体目标检测方法,该方法是从视频帧中选取少量有真实标签的图像,剩下其它视频帧作为无真实标签图像;两类图像同时送入深度网络中训练网络;训练过程会有所不同,带有真实标签图像可以正常训练,但是无真实标签图像无法正常训练,所以会先通过网络获得高置信度的位置信息作为无真实标签图像的临时标签,然后再进行正常的训练;为了能够使网络不被临时标签的图像带偏,通过后续筛选和权重设置加以限制;直到网络模型训练到预先设定的次数。本发明方法是同时训练两类图像,只需要一个阶段,节约大量的时间成本。
技术领域
本发明涉及计算机视觉的技术领域,尤其是指一种单阶段半监督图像人体目标检测方法。
背景技术
行人检测是利用计算机视觉技术识别图像或者视频帧中是否存在行人并给予精确定位。该技术应用领域广泛,可与行人跟踪、行人重识别等技术结合,能够很好地应用于人工智能系统、车辆辅助驾驶系统、智能视频监控、人体行为分析、智能交通等现实场景领域。
由于行人一些独特的特性,外观易受穿着颜色、尺度、遮挡、姿态和视角等多方面影响,使得行人检测成为计算机视觉领域中一个不仅具有研究价值而且又极具挑战性的热门研究课题。
半监督学习是模式识别领域和机器学习领域研究的重点问题,也是有监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的无真实标签数据,同时使用少量真实标签数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习目前正越来越受到人们的重视。
基于统计学习的方法根据大量的图像构建行人检测分类器。提取的特征主要有目标的灰度、边缘、纹理、颜色、梯度直方图等信息。分类器主要包括神经网络、SVM、adaboost以及现在被计算机视觉视为宠儿的深度学习。由于深度神经网络,通过引入具有CNN特征的区域(R-CNN)获得了更显着的增益。DNN或最具代表性的CNN以与传统方法完全不同的方式起作用。他们拥有更深层次的架构,能够学习比浅层更复杂的功能。此外,表现力和强大的训练算法允许学习信息对象表示,而无需手动设计功能。
自R-CNN的提议以来,已经提出了大量改进的模型,包括Fast R-CNN,它共同优化了分类和边界框回归任务,Faster R-CNN需要额外的子网来生成区域提议和YOLO通过固定网格回归完成目标检测。所有这些都比原始R-CNN带来不同程度的检测性能改进,使得实时和准确的物体检测变得更加可实现。
发明内容
本发明的目的在于克服现有半监督训练过程繁琐的问题,提出了一种单阶段半监督图像人体目标检测方法,该方法只需要训练一轮就可以得到性能良好的检测效果,有效的节省了大量的时间。
为实现上述目的,本发明所提供的技术方案为:一种单阶段半监督图像人体目标检测方法,包括以下步骤:
S1、对视频帧数据进行划分,分有真实标签图像集合无真实标签图像集合和测试数据集合
S2、从无真实标签图像集合中获取一张无真实标签图像经过VGG16网络和RPN网络得到预测的位置坐标信息和相应的得分信息,将高置信度的位置坐标信息和得分信息送入到IoU网络,得到预测交并比信息,选取预测交并比大于或等于预定阈值的人体框预测信息作为该无真实标签图像的临时标签;
S3、输入两张图像到整个网络的入口,该整个网络是由VGG16、RPN和IoU三个网络组成,记为网络VGG16+RPN+IoU,其中一张为步骤S2的无真实标签图像另一张为从真实标签图像集合种获取的真实标签图像用于当前一轮的训练,用损失函数进行约束;
S4、重复步骤S2-S3,达到预先设定训练次数后完成训练;
S5、用测试数据集合对训练好的完整网络VGG16+RPN+IoU进行测试评估,得到人体目标检测的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010114793.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序