[发明专利]一种基于深度学习的训练数据平衡方法、设备和系统有效

申请号：	202010461701.0	申请日：	2020-05-27
公开（公告）号：	CN111598185B	公开（公告）日：	2021-11-19
发明（设计）人：	宋梦;刘奔;汪明润;王华文	申请（专利权）人：	深圳市铁越电气有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京维正专利代理有限公司 11508	代理人：	何星民
地址：	518000 广东省深圳市龙岗区龙城街道黄***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习训练数据平衡方法设备系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度学习的训练数据平衡方法、设备和系统，属于图像识别技术领域。本发明通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例，与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例，调整训练数据中目标类别的图片数量，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。

技术领域

本发明涉及图像识别技术领域，尤其是涉及一种基于深度学习的训练数据平衡方法、设备和系统。

背景技术

近年来，随着深度学习技术和目标检测的发展，为了提高深度学习和目标检测的效果，需要对训练数据进行平衡，从而提高深度学习和目标检测的可靠性。

现有技术提供了一种一种训练数据平衡方法，包括：首先取出数据集中多数类和少数类样本集合并计数，对多少样本类进行聚类和对少数类样本进行过采样，然后对多数和少数类样本集合进行相组合，并抽取其特征加入到类别平衡的新数据集中，然后对新特征进行训练。

但是现有技术存在如下问题：

在对训练数据平衡过程中，并未避免由少量样本类中的锚框个数不平衡所导致的可靠性降低的问题。

发明内容

为了解决现有技术的问题，本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统，包括：

一方面，提供了一种基于深度学习的训练数据平衡方法，所述方法包括：

获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例；