[发明专利]一种自适应数据增强的二维人体姿态估计方法和系统有效
申请号: | 202011103590.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112200102B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 邹腊梅;车鑫;乔森;聂士伟;杨卫东 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/82;G06N3/0464;G06N3/047 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 数据 增强 二维 人体 姿态 估计 方法 系统 | ||
本发明公开了一种自适应数据增强的二维人体姿态估计方法和系统,属于计算机视觉和深度学习领域。本发明不同于将数据增强作为一个独立的数据预处理步骤的常规做法,将数据增强和用于执行计算机视觉任务的卷积神经网络的训练两个独立的过程联合起来,使得数据增强能跟随卷积神经网络的训练过程实现动态更新,自适应的根据具体数据集特点和应用任务产生数据增强操作的概率分布,产生对卷积神经网络优化更加有效的训练样本,提升卷积神经网络的训练效率,同时有效增强卷积神经网络的泛化能力;本发明以数据增强模块为生成器,以卷积神经网络为判别器,通过两者“博弈”实现共同优化,最终实现执行计算机视觉任务的卷积神经网络模型更优的表现。
技术领域
本发明属于计算机视觉和深度学习领域,更具体地,涉及一种自适应数据增强的计算机视觉任务执行方法和系统。
背景技术
从本质上说,深度学习是用复杂模型拟合大量数据的过程,数据的质量和数量是决定卷积神经网络模型泛化性能的重要因素。在使用深度学习方法解决具体计算机视觉任务时,训练样本不充足是一个普遍存在的障碍。一方面,数据集的制作需要花费高昂的成本;另一方面,通过数据增强增加数据的多样性可以有效缓解卷积神经网络在训练过程中的过拟合现象。因此,数据增强是深度学习中不可或缺的关键一环。
目前普遍采用的常规数据增强操作有颜色变化、几何变换、翻转、尺度缩放、添加噪声等,这些操作一定程度上模拟了现实场景中的视角、光线、尺度等方面的变换,因此可提升卷积神经网络的泛化性能。但是,常规数据增强操作作为卷积神经网络训练的数据预处理的步骤之一,独立于卷积神经网络训练过程,直接从静态分布中采样,是一种“盲目”的操作,会增加部分无关的数据,不能跟踪动态的卷积神经网络训练过程,导致卷积神经网络的训练效率不高。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种自适应数据增强的计算机视觉任务执行方法和系统,其目的在于解决常规数据增强是“盲目”的,会增加无关数据,不能自适应具体数据集特点和应用任务,导致训练效率不高的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种自适应数据增强的计算机视觉任务执行方法,包括:
S1.构建用于执行计算机视觉任务的卷积神经网络,并进行预训练得到卷积神经网络的预训练模型;
S2.构建数据增强模块,并进行预训练得到数据增强模块的预训练模型;所述数据增强模块的输入为卷积神经网络不同尺度的层间特征图,输出为数据增强操作的概率分布;
S3.以数据增强模块为生成器,以所述卷积神经网络作为判别器,采用奖励惩罚措施对数据增强模块与卷积神经网络进行联合优化;其中,卷积神经网络的预训练模型和数据增强模块的预训练模型作为联合优化的初始值;所述卷积神经网络根据数据增强模块生成的概率分布实施自适应数据增强操作;
S4.采用训练好的卷积神经网络和数据增强模块执行计算机视觉任务。
进一步地,数据增强模块包括:跨阶段瓶颈模块、池化层和全连接层;
数据增强模块对卷积神经网络不同尺度的层间特征图进行融合,融合后的特征图输入全连接层得到概率分布,在数据送入卷积神经网络进行训练之前,数据要根据此概率分布进行数据增强操作;其中,每两个相邻的层间特征图融合过程为:尺度较大的特征图通过跨阶段瓶颈模块提取特征后,通过池化层进行下采样,再与尺度较小的特征图经过跨阶段瓶颈模块提取得到的特征进行融合。
进一步地,对数据增强模块进行预训练,具体包括:
从m个有界高斯分布中采样,对应的采样概率为{p1,p2,…,pm},满足m表示设定的常数;
对每一个训练样本,根据采样结果进行数据增强操作,得到m个新的训练样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011103590.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无机高分子灌浆堵漏材料及其生产工艺
- 下一篇:一种用于盲孔内轴承的取出装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置