[发明专利]人工神经网络调整方法和装置有效
申请号: | 201810653962.5 | 申请日: | 2018-06-22 |
公开(公告)号: | CN110633722B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 刘吉;田露 | 申请(专利权)人: | 赛灵思电子科技(北京)有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/764;G06V10/94;G06V40/16 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 100029 北京市朝阳区安定路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工 神经网络 调整 方法 装置 | ||
提出了一种人工神经网络(ANN)调整方法和装置。所述ANN包括多个层并且被训练用于进行分类推理。例如,所述ANN可以是被训练用于细粒度图像识别的神经网络。所述方法包括:将训练数据集按照当前所针对的类别划分为当前类别和其他类别,其中,属于所述当前类别的数据特征被称为正类特征,属于所述其他类别的数据特征被称为反类特征;以及以规定所述正类特征比所述反类特征相距所述当前类别的当前类别特征中心近的第一损失函数对所述ANN进行调整。本发明从损失函数着手,设计了一种有效的损失函数,能够拉近类内的距离,增大类间距离,提高分类效果,进而从整体上提升人工神经网络的预测精度。
技术领域
本发明涉及深度学习,尤其涉及对人工神经网络的调整方法和装置。
背景技术
近些年来,人工神经网络(ANN)在目标检测、图像分类等领域都取得了重大进展。在这其中,细粒度分类任务是一种从基础父类的成千上百的子类中正确识别目标的颇具挑战性的图像识别任务。由于子类之间的区别通常较小,并且姿势、旋转等原因会导致类内的偏差较大,使得细粒度分类的准确度难以提升。为了解决这一问题,目前的研究大部分依靠于获得具有区分性的部位(比如鸟类的喙、脚等)的定位来产生细粒度特征,而这种方法通常依赖于局部位置的标注,需要附加额外的人力成本且增加了系统的复杂性。
有鉴于此,仍然需要一种改进的神经网络调整方法。
发明内容
本发明从损失函数着手,设计了一种有效的损失函数,能够拉近类内的距离,增大类间距离,提高分类效果。进而整体提升人工神经网络的预测精度。
根据本发明的一个方面,提出了一种人工神经网络(ANN)调整方法,所述ANN包括多个层并且被训练用于进行分类推理。例如,所述ANN是被训练用于细粒度图像识别的神经网络。所述方法包括:将训练数据集按照当前所针对的类别划分为当前类别和其他类别,其中,属于所述当前类别的数据特征被称为正类特征,属于所述其他类别的数据特征被称为反类特征;以及以第一损失函数对所述ANN进行调整,所述第一损失函数规定所述正类特征与所述当前类别的当前类别特征中心的距离比所述反类特征与所述当前类别的当前类别特征中心的距离近。由此,能够通过引入拉近正类特征并推远反类特征的损失函数来使得各个分类的聚类更为紧凑,由此提升网络的分类准确性。
所述第一损失函数可以是规定所述正类特征比所述反类特征相距所述当前类别特征中心要近上一个预定阈值的损失函数。
优选地,ANN调整方法还可以包括:从所述反类特征中计算出与所述当前类别特征中心距离最近的类别的数据特征作为距离最近反类特征,其中,以第一损失函数对ANN进行调整包括:以规定所述正类特征比所述距离最近反类特征相距所述当前类别特征中心近的第一损失函数对所述ANN进行调整。第一损失函数优选可以基于下式进行计算:
其中,和分别是当前类别和其他类别的数据集合,Np和Nn分别是当前类别和其他类别的数据样本数目,C是当前类别特征中心,α是预定阈值,是所述正类特征,是所述距离最近反类特征。
优选地,以第一损失函数对所述ANN进行调整包括:计算所述正类特征、距离最近反类特征和/或所述正类中心的梯度;以及使用所述梯度更新所述正类特征、距离最近反类特征和/或所述正类中心。
可以基于下式计算所述正类特征、所述距离最近反类特征和/或所述正类中心的梯度:
其中,Np'表示不满足距离限制条件的当前类别的数据样本数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛灵思电子科技(北京)有限公司,未经赛灵思电子科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810653962.5/2.html,转载请声明来源钻瓜专利网。