[发明专利]数据增强方法、装置、计算设备以及计算机可读存储介质在审
申请号: | 202011606784.4 | 申请日: | 2020-12-30 |
公开(公告)号: | CN114462628A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 罗罡;李庆瑞;李俊明;陶韬 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N20/20 | 分类号: | G06N20/20 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 增强 方法 装置 计算 设备 以及 计算机 可读 存储 介质 | ||
本申请公开了一种数据增强方法、装置、计算设备以及计算机可读存储介质,属于人工智能技术领域。本方法通过数据增强策略中的多种数据增强操作,对样本进行处理,能够得到多个目标增强样本,从而达到了扩充样本的目的,并且由于是在多种数据增强操作的目标操作等级所指示的操作强度变化区间内,对样本进行多种数据增强操作,从而得到的多个目标增强样本能够在多种数据增强操作的目标操作等级所指示的操作强度变化区间之内具有变化,提高了样本的多样性。
本申请要求于2020年11月09日提交的申请号为202011237954.6、发明名称为“实现数据增强策略的方法和系统”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及人工智能技术领域,特别涉及一种数据增强方法、装置、计算设备以及计算机可读存储介质。
背景技术
随着人工智能(artificial intelligence,AI)技术的发展,深度学习模型作为人工智能的主流算法模型,被广泛运用在计算机视觉、自然语言处理、语言识别等领域,而且都取得了优异的表现。比起传统机器学习模型,深度学习模型能从大量标注数据(即由标签标注的样本)中萃取阶层性的表征(representation)。这些通过学习得到的、分层次的表征正是深度学习模型取得优越表现(不管是分类或回归)的关键。
例如具有识别功能的深度学习模型(简称识别模型)在学习的过程中需要大量的样本,在很多情况下,样本的数量、质量对训练出的识别模型的表现起到至关重要甚至决定性的影响。然而现有样本(包括公开的或私有的样本)并不能完全满足某些业务场景在数量和质量方面的需求。例如,在很多特殊或复杂业务场景下的样本的数据量不足或样本类别单一,致使训练出的识别模型出现准确度低、泛化能力低等问题。
目前,一般通过数据增强技术来扩充样本,例如按照数据增强策略中每种数据增强操作的操作强度,对样本进行每种数据增强操作,将得到的增强样本作为应用场景下实际的样本,以扩充该应用场景的样本量。通过这种数据增强操作策略中每种数据增强操作的操作强度,对样本进行每种数据增强操作,所得到的增强样本的类别单一,缺乏多样性。
发明内容
本申请实施例提供了一种数据增强方法、装置、计算设备、芯片及计算机存储介质,能够提高样本的多样性。该技术方案如下:
第一方面,提供了一种数据增强方法,由第一节点执行,所述方法包括:
获取第一目标数据增强策略;基于所述第一目标数据增强策略,在多种数据增强操作的目标操作等级所指示的操作强度变化区间内,对第一样本进行所述多种数据增强操作,得到所述第一样本的多个目标增强样本,其中,所述第一目标数据增强策略用于指示数据增强操作的目标操作等级,一个目标操作等级用于指示一个操作强度变化区间。
本方法通过数据增强策略所指示的多种数据增强操作,对样本进行处理,能够得到多个目标增强样本,从而达到了扩充样本的目的,并且由于是在多种数据增强操作的目标操作等级所指示的操作强度变化区间内,对样本进行多种数据增强操作,从而得到的多个目标增强样本能够在多种数据增强操作的目标操作等级所指示的操作强度变化区间之内具有变化,提高了样本的多样性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011606784.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置