[发明专利]一种基于深度学习的训练数据平衡方法、设备和系统有效
申请号: | 202010461701.0 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111598185B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 宋梦;刘奔;汪明润;王华文 | 申请(专利权)人: | 深圳市铁越电气有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 何星民 |
地址: | 518000 广东省深圳市龙岗区龙城街道黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 训练 数据 平衡 方法 设备 系统 | ||
本发明公开了一种基于深度学习的训练数据平衡方法、设备和系统,属于图像识别技术领域。本发明通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例,调整训练数据中目标类别的图片数量,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种基于深度学习的训练数据平衡方法、设备和系统。
背景技术
近年来,随着深度学习技术和目标检测的发展,为了提高深度学习和目标检测的效果,需要对训练数据进行平衡,从而提高深度学习和目标检测的可靠性。
现有技术提供了一种一种训练数据平衡方法,包括:首先取出数据集中多数类和少数类样本集合并计数,对多少样本类进行聚类和对少数类样本进行过采样,然后对多数和少数类样本集合进行相组合,并抽取其特征加入到类别平衡的新数据集中,然后对新特征进行训练。
但是现有技术存在如下问题:
在对训练数据平衡过程中,并未避免由少量样本类中的锚框个数不平衡所导致的可靠性降低的问题。
发明内容
为了解决现有技术的问题,本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统,包括:
一方面,提供了一种基于深度学习的训练数据平衡方法,所述方法包括:
获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片之前,所述方法还包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。
可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量之前,所述方法还包括:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据中所述目标类别的图片数量。
可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量包括:
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市铁越电气有限公司,未经深圳市铁越电气有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461701.0/2.html,转载请声明来源钻瓜专利网。