[发明专利]一种复杂场景目标检测数据集构建方法及系统在审
申请号: | 202011438924.1 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112560925A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 秦文健;朱思航;何佳慧;曾光;产银萍 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 场景 目标 检测 数据 构建 方法 系统 | ||
1.一种复杂场景目标检测数据集构建方法,包括以下步骤:
从公开数据集中筛选出适用于视障人群生活场景的图像,构成初始数据集;
利用深度学习特征提取模型来提取所述初始数据集对应的多维深度特征数据;
利用所述初始数据集及对应的多维深度特征数据进行无监督学习,以将所述多维特征数据整合到无监督聚类模型中,进而将聚类得到的视障人群生活场景的图像构成数据集;
基于所述数据集训练生成对抗网络,该生成对抗网络包括图像生成器和图像判别器,其中图像生成器基于所述数据集和不同风格图像来生成图像,并将生成图像输入训练的所述深度学习特征提取模型来提取特征,图像判别器针对所提取的生成图像的特征和所述不同风格图像特征进行对抗训练;
利用经训练的图像生成器构建多种场景的目标检测数据集。
2.根据权利要求1所述的方法,其中,利用深度学习特征提取模型来提取所述初始数据集对应的多维深度特征数据包括:
将所述初始数据集输入到残差网络得到特征图;
对于所述特征图利用金字塔结构提取不同尺度的多维深度特征数据。
3.根据权利要求1所述的方法,其中,还包括:
利用经训练的图像生成器获得的带标注的符合视障人群生活需求的感兴趣目标;
对于部分未进行数据标注的图像中每个人的脸部标识或生活场景的标识,进行多目标实例标注;
利用所有标注数据通过网络学习进行调整,获得最终的目标检测数据集。
4.根据权利要求1所述的方法,其中,所述多维深度特征数据包括感兴趣区域图像块的颜色、形态学、纹理和空间分布特征。
5.根据权利要求1所述的方法,其中,所述生成对抗网络训练过程的损失函数包含常规的生成对抗网络损失函数和循环一致性损失函数,并通过设置调节系数来调整该循环一致性损失函数的权重。
6.根据权利要求1所述的方法,其中,所述不同风格图像包括不同光照和不同场景图像。
7.一种复杂场景目标检测数据集构建系统,包括:
图像搜集模块:用于从公开数据集中筛选出适用于视障人群生活场景的图像,构成初始数据集;
特征提取模块:用于利用深度学习特征提取模型来提取所述初始数据集对应的多维深度特征数据;
图像筛选模块:用于利用所述初始数据集及对应的多维深度特征数据进行无监督学习,以将所述多维特征数据整合到无监督聚类模型中,进而将聚类得到的视障人群生活场景的图像构成数据集;
对抗训练模块:用于基于所述数据集训练生成对抗网络,该生成对抗网络包括图像生成器和图像判别器,其中图像生成器基于所述数据集和不同风格图像来生成图像,并将生成图像输入训练的所述深度学习特征提取模型来提取特征,图像判别器针对所提取的生成图像的特征和所述不同风格图像特征进行对抗训练;
图像标注模块:用带标注的数据集预训练网络,以检测出视障人群感兴趣的目标;
数据集构建模块:用于利用经训练的图像生成器构建多种场景的目标检测数据集。
8.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至6中任一项所述方法的步骤。
9.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011438924.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有智能化可调光源的视觉采集方法和装置
- 下一篇:一种手套浸胶装置