[发明专利]一种复杂场景目标检测数据集构建方法及系统在审
申请号: | 202011438924.1 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112560925A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 秦文健;朱思航;何佳慧;曾光;产银萍 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 场景 目标 检测 数据 构建 方法 系统 | ||
本发明公开了一种复杂场景目标检测数据集构建方法及系统。该方法包括:从公开数据集中筛选出适用于视障人群生活场景的图像,构成初始数据集;利用深度学习特征提取模型来提取所述初始数据集对应的多维深度特征数据;利用所述初始数据集及对应的多维深度特征数据进行无监督学习,以将所述多维特征数据整合到无监督聚类模型中,进而将聚类得到的视障人群生活场景的图像构成数据集;基于所述数据集训练生成对抗网络;利用经训练的生成对抗网络的生成器构建多种场景的目标检测数据集。利用本发明构建的数据集,适用于视障人群生活场景的目标检测,解决了数据样本丰富和准确标定之间的矛盾。
技术领域
本发明涉及图像处理技术领域,更具体地,涉及一种复杂场景目标检测数据集构建方法及系统。
背景技术
在现有技术中,已经公开类似车载摄像头的视频KITTI跟踪数据集,或显示了各种不同视角的行人MOT Challenge数据集,或静态场景解析的ADE20K数据集都是用于无人驾驶的检测算法的benchmark(标准)数据集。目前并没有一套适用于视障人群生活场景解析的数据集,例如社区、学校和工作场所等。
目前大部分建立标准的训练和验证数据库主要是人工采集图像,并手动对图像的感兴趣的目标进行标定。但是由于视障人群生活场景图像的复杂性、光照变化不均匀、数据量大等自身特点,人工标注结果一方面工作量过于繁重,另一方面又受限于标注者自身经验主观性以及图像中本身就出现的人肉眼难以区分的对象。如果要在短期内构建标准的训练和验证数据库以用于模型训练,人工采集并标注的方法已无法满足研究和生产工作的需要。
基于深度学习的数据集构建方法成为近年来国内外非常热门的前沿领域之一。相对于传统的人工采集标注,计算机图像生成标注具有多样性、量化和低成本的优势,从而提高了图像标注的准确性和工作效率。现有技术往往是通过生成对抗网络(GAN)来生成图像,以扩展数据样本的多样性。但是生成的样本并不含有标准信息,无法适用于目标检测任务。
目前目标检测benchmark的构建还主要依靠人工采集和图像生成的方法来组建,后期再依靠人工标注。在针对视障人群构建复杂生活场景的数据集过程中,这种方法仍具有一定的缺陷,这主要是因为:
1)、图像的复杂性。由于生活场景的多样,图像中会出现遮挡,运动物体的畸变,低照度下的物体肉眼难以识别。
2)、图像的多样性。要使构建的数据集足以训练鲁棒性高的检测器需要丰富的、大量的数据,而在一定时期内搜集相关场景并拍摄的方法不足以涵盖各种情况。
3)、标注的工作量巨大。由于构建一个好的数据集需要大量的数据样本,要训练一个好的检测器,如何对上万张图像进行标注也是个非常大的技术难点。
上述技术问题制约了实际生产和研究的应用,据目前已发表的文献来看,尚没有一个系统的解决方案来构建适用于视障人群生活场景的目标检测,尤其是难以解决数据样本丰富和准确标定之间的矛盾。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种复杂场景目标检测数据集构建方法及系统,基于生成对抗方法构建数据集,生成多种光照、不同场景下的图像数据,通过利用深度学习方法批量生成数据,使得构造数据集的工作效率大幅提升。
根据本发明的第一方面,提供一种复杂场景目标检测数据集构建方法。该方法包括以下步骤:
从公开数据集中筛选出适用于视障人群生活场景的图像,构成初始数据集;
利用深度学习特征提取模型来提取所述初始数据集对应的多维深度特征数据;
利用所述初始数据集及对应的多维深度特征数据进行无监督学习,以将所述多维特征数据整合到无监督聚类模型中,进而将聚类得到的视障人群生活场景的图像构成数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011438924.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有智能化可调光源的视觉采集方法和装置
- 下一篇:一种手套浸胶装置