[发明专利]一种提高卷积神经网络精确性和鲁棒性的增强数据增强方法有效

申请号：	202010130295.X	申请日：	2020-02-28
公开（公告）号：	CN111368977B	公开（公告）日：	2023-05-02
发明（设计）人：	张林峰	申请（专利权）人：	交叉信息核心技术研究院（西安）有限公司
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/82;G06V10/42;G06V10/764;G06N3/0464;G06N3/047;G06N3/084
代理公司：	北京中巡通大知识产权代理有限公司 11703	代理人：	李宏德
地址：	710077 陕西省西安***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种提高卷积神经网络精确性鲁棒性增强数据方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明一种提高卷积神经网络精确性和鲁棒性的增强数据增强方法，使得神经网络仅需要学习干净数据以及其与其它形式的数据的关系，而不需要直接记忆所有数据形式，从而促进在复杂和不同数据集上的神经网络训练。其包括如下步骤，步骤1，将干净图像和从其中生成的损坏图像作为一对图像，同批输入到神经网络中；步骤2，以从干净数据和损坏数据中获得相同的全局特征以及预测为目的，将与该两个图像有关的四种损失应用于softmax层和特征的输出，完成增强数据增强。本发明是将增强数据视为原始数据的一个扩展集合，共享相同的标签，然后将原始数据和增强数据的特征，以及softmax层的输出之间的距离最小化，达到对神经网络精确性和鲁棒性的同时提升。

技术领域

本发明涉及卷积神经网络的数据增强方法，具体为一种提高卷积神经网络精确性和鲁棒性的增强数据增强方法。

背景技术

现代人工智能通常基于以下一个关键基本假设：训练数据和测试数据是独立且同分布(IID)。但是，IID假设并不总是成立。但是，数据集中有限的数据始终不足以覆盖现实世界中的所有可能性，这与假设相悖，并导致应用程序中部署的模型的精确度大幅下降。以图像为例，应用场景中的自然图像总是受例如亮度、天气、视角和摄像机等拍摄环境的影响，而这些环境又不能完全被有限的训练数据所覆盖。图1示出了在干净图像上训练模型，并且在通过各种角度旋转的图像上测试模型的情况。在旋转角度仅为10°的情况下，模型的精确度下降10.28％，这表明测试数据和训练数据之间的微小差异可能导致精确度的大幅度下降。

对该问题的有效且广泛使用的解决方案是增加训练数据，即通过现有数据生成新样本，增加数据集的多样性解决此问题。例如对原始图像添加噪声和使其模糊以模拟损坏相机拍摄的自然图像。以此方式，训练数据与测试数据之间的散度可能较小，从而减轻了所部署的模型所面临的精确度下降。

不幸的是，公共数据增强仍然存在缺陷，由数据增强导致的数据多样性增加降低了对于干净图像的预测精确度，并且需要对网络的额外训练，从而使得增加训练数据的多样性加剧了神经网络的训练困难。图2示出了在两种数据形式(干净图像和旋转图像)上训练和评估的ResNet 18的精确度。随着旋转角度的增加，两种数据形式之间的差异增加，并且两种数据形式的精确度都有显著下降。这种现象易于解释：要学习的内容(更多图像形式)的增加给网络带来更多的挑战，例如严重遗忘。

因此现有技术中急需一种能够同时提高卷积神经网络精确性和鲁棒性的方法。

发明内容

针对现有技术中存在的问题，本发明提供一种提高卷积神经网络精确性和鲁棒性的增强数据增强方法，使得神经网络仅需要学习干净数据以及其与其它形式的数据的关系，而不需要直接记忆所有数据形式，从而促进在复杂和不同数据集上的神经网络训练。

本发明是通过以下技术方案来实现：

一种提高卷积神经网络精确性和鲁棒性的增强数据增强方法，包括如下步骤，

步骤1，将干净图像和从其中生成的损坏图像作为一对图像，同批输入到神经网络中；

步骤2，以从干净数据和损坏数据中获得相同的全局特征以及预测为目的，将与该两个图像有关的四种损失应用于softmax层和特征的输出，完成增强数据增强；

具体的，

将标签和干净图像的softmax输出之间的交叉墒损失，应用到干净数据的softmax层和特征的输出；

将输入的两个图像的softmax输出之间的KL散度损失和关系角度损失，应用于干净数据和损坏数据的softmax输出之间；

将输入的两个图像的全局特征之间的L₂损失，应用于干净数据和损坏数据的全局特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。