[发明专利]神经网络训练方法、图像处理方法及装置在审
申请号: | 202010035139.5 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111260032A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王诚 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李英艳;冯志云 |
地址: | 100080 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 图像 处理 装置 | ||
本公开提供了神经网络训练方法、图像处理方法及装置。其中神经网络训练方法包括:获取总训练集,总训练集包括多个类别的训练数据;针对每一训练轮次,基于总训练集,对每个类别的训练数据进行采样,得到子训练集;根据神经网络对子训练集中的每个类别的训练数据进行特征提取,得到特征向量;基于当前神经网络,确定每个类别的中心向量,其中中心向量作为锚点;基于中心向量和特征向量获得损失函数的值,并调整神经网络的参数。通过在训练过程中,根据当前神经网络确定中心向量,使中心向量具有全局信息,从而基于中心向量计算损失并调整神经网络的参数,提高训练效率,加快神经网络输出结果的收敛速度,并降低获取训练样本难度,提高训练效果。
技术领域
本发明一般地涉及图像识别技术领域,特别是涉及一种神经网络训练方法、图像处理方法及装置,以及电子设备和计算机可读存储介质。
背景技术
目前神经网络训练过程中,通过大量训练样本的多次迭代训练,进行度量学习是为了学习一个在图片上的距离函数,使得同一类别的图片将被映射到相邻的位置,具有不同类别的图片将被映射到互相远离的地方。在深度学习的方法中,这个距离函数即是网络的特征嵌入,现在的有很多基于深度的度量学习损失,例如对比损失(Contrastive Loss)、三元组损失(Triplet Loss)、四元组损失(Quadruplet Loss)等。这些损失都在一些相关联的样本上计算,都有相同的目标,即鼓励相同类的样本相互接近,不同类的样本相互远离。
对于一些相关度量学习技术来说,由于资源的限制,存在着只能在局部样本上进行优化的问题。具体来说,目前深度网络通常是使用随机梯度下降算法优化的,因此梯度只来源于一小批样本。这样对于相关的度量学习损失来说,只看到了局部的数据分布,无法优化到全局的最优。如果无限制的对样本进行采样,不仅引入了大的计算量,还将同时引入大量的无信息样本对,影响模型的收敛速度和性能。
发明内容
为了解决现有技术中存在的上述问题,本发明提供一种神经网络训练方法、图像处理方法及装置,以及电子设备和计算机可读存储介质。
根据本公开实施例的第一方面,提供一种神经网络训练方法,包括:获取总训练集,总训练集包括多个类别的训练数据,其中每个类别包括一个或多个训练数据;针对每一训练轮次,基于总训练集,对每个类别的训练数据进行采样,得到采样后的训练数据组成的子训练集;根据神经网络对子训练集中的每个类别的训练数据进行特征提取,得到特征向量;基于当前神经网络,确定每个类别的中心向量,其中中心向量作为锚点;基于中心向量和特征向量获得损失函数的值,根据损失函数的值调整神经网络的参数。
在一例中,基于当前神经网络,确定每个类别的中心向量,包括:基于当前训练轮次的子训练集中每个类别的训练数据的特征向量,分别对特征向量对应类别的历史中心向量进行更新,得到每个类别的当前训练轮次的中心向量,其中历史中心向量为前一训练轮次的中心向量,对于第一训练轮次的前一训练轮次的中心向量为预设的每个类别的初始中心向量。
在一例中,基于当前训练轮次的子训练集中每个类别的训练数据的特征向量,分别对特征向量对应类别的历史中心向量进行更新,采用以下方式:分别设置子训练集中每个训练数据的特征向量的第一权重,以及历史中心向量的第二权重;基于第一权重和第二权重,对当前训练轮次每个类别的训练数据的特征向量与对应类别的历史中心向量进行加权,获得对应类别当前训练轮次的中心向量。
在一例中,基于当前训练轮次的子训练集中每个类别的训练数据的特征向量,分别对特征向量对应类别的历史中心向量进行更新,采用以下方式:基于每个类别的训练数据的特征向量,确定与每个类别对应的中心损失;基于中心损失,更新对应类别的历史中心向量,得到对应类别的当前训练轮次中心向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010035139.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序