[发明专利]人工神经网络调整方法和装置有效
申请号: | 201810653962.5 | 申请日: | 2018-06-22 |
公开(公告)号: | CN110633722B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 刘吉;田露 | 申请(专利权)人: | 赛灵思电子科技(北京)有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/764;G06V10/94;G06V40/16 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 100029 北京市朝阳区安定路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工 神经网络 调整 方法 装置 | ||
1.一种人工神经网络ANN调整方法,所述ANN包括多个层并且被训练用于进行细粒度图像识别的分类推理,所述方法包括:
将训练图像数据集按照当前所针对的类别划分为当前类别和其他类别,其中,属于所述当前类别的数据特征被称为正类特征,属于所述其他类别的数据特征被称为反类特征;以及
以第一损失函数对所述ANN进行调整,所述第一损失函数规定所述正类特征与所述当前类别的当前类别特征中心的距离比所述反类特征与所述当前类别的当前类别特征中心的距离近,
其中,所述ANN用于进行目标共M类的细粒度图像识别的分类任务,对于每个类别,训练图像数据集被划分为两部分,即针对一个当前类别的正类集合以及针对M-1个其他类别的反类集合,并且当前类别特征中心在针对每个当前类别和/或每个训练批次中被持续调整,
其中,所述方法还包括:
使用第三损失函数与所述第一损失函数对所述ANN进行联合调整,所述第三损失函数对分类特征中心的夹角进行约束,以使得各个分类特征中心的夹角分布趋于均匀。
2.如权利要求1所述的方法,其中,所述第一损失函数是规定所述正类特征比所述反类特征相距所述当前类别特征中心要近上一个预定阈值的损失函数。
3.如权利要求1所述的方法,还包括:
从所述反类特征中计算出与所述当前类别特征中心距离最近的类别的数据特征作为距离最近反类特征,
其中,以第一损失函数对所述ANN进行调整包括:
以规定所述正类特征比所述距离最近反类特征相距所述当前类别特征中心近的第一损失函数对所述ANN进行调整。
4.如权利要求3所述的方法,其中,所述第一损失函数基于下式进行计算:
其中,和分别是当前类别和其他类别的数据集合,Np和Nn分别是当前类别和其他类别的数据样本数目,C是当前类别特征中心,α是预定阈值,是所述正类特征,是所述距离最近反类特征。
5.如权利要求3所述的方法,其中,以第一损失函数对所述ANN进行调整包括:
计算所述正类特征、距离最近反类特征和/或正类中心的梯度;以及
使用所述梯度更新所述正类特征、距离最近反类特征和/或所述正类中心。
6.如权利要求5所述的方法,其中,基于下式计算所述正类特征、所述距离最近反类特征和/或所述正类中心的梯度:
其中,Np'表示不满足距离限制条件的当前类别的数据样本数目。
7.如权利要求1所述的方法,还包括:
在完成所述当前类别下的调整之后,逐一将所述其他类别中的一个类别作为当前类别进行基于所述第一损失函数的ANN调整,以完成对作为当前训练批次的所述训练图像数据集的训练。
8.如权利要求7所述的方法,还包括:
针对每个训练批次迭代进行针对每个类别逐一作为当前类别的基于所述第一损失函数的ANN调整。
9.如权利要求7或8所述的方法,其中,所述当前类别特征中心在针对每个当前类别和/或每个训练批次中被持续调整。
10.如权利要求1所述的方法,所述方法包括:
在使用第一损失函数对所述ANN进行调整之前,使用第二损失函数对所述ANN进行初始训练。
11.如权利要求1所述的方法,其中,所述第一损失函数和第三损失函数在所述ANN的调整过程中被赋予不同的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛灵思电子科技(北京)有限公司,未经赛灵思电子科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810653962.5/1.html,转载请声明来源钻瓜专利网。