[发明专利]卷积神经网络的训练方法及装置有效
申请号: | 201710539510.X | 申请日: | 2017-07-04 |
公开(公告)号: | CN107480785B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 陈志军 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 代治国 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 训练 方法 装置 | ||
本公开是关于卷积神经网络的训练方法及装置。该方法包括:在接收到向卷积神经网络输入的图片样本时,获取卷积神经网络对图片样本的当前识别结果;根据图片样本的预设识别结果,确定图片样本的识别间隔参数;根据当前识别结果和识别间隔参数,确定图片样本的目标识别损失值;根据图片样本的目标识别损失值,调整卷积神经网络的网络参数。该技术方案,可以使得目标识别损失值更为准确、能够体现出不同图片样本之间的距离间隔,这样,通过目标识别损失值调整后的网络参数就会更加精准,使调整后的卷积神经网络能够更加有效地区分开具有差异的不同样本,进而使得卷积神经网络的识别结果更为准确。
技术领域
本公开涉及深度学习技术领域,尤其涉及卷积神经网络的训练方法及装置。
背景技术
目前,为了更好地识别图片,越来越多的识别过程使用到CNN网络(ConvolutionalNeural Network,卷积神经网络),而为了确保识别结果准确,就需要对CNN网络等进行反复训练以使CNN网络中的网络参数更为精准,但相关技术中的训练结果却不太理想,导致CNN网络的图片识别结果不太准确。
发明内容
本公开实施例提供了卷积神经网络的训练方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种卷积神经网络的训练方法,包括:
在接收到向所述卷积神经网络输入的图片样本时,获取所述卷积神经网络对所述图片样本的当前识别结果;
根据所述图片样本的预设识别结果,确定所述图片样本的识别间隔参数;
根据所述当前识别结果和所述识别间隔参数,确定所述图片样本的目标识别损失值;
根据所述图片样本的目标识别损失值,调整所述卷积神经网络的网络参数。
在一个实施例中,所述图片样本包括N个三元组,其中,N为正整数;
所述根据所述图片样本的预设识别结果,确定所述图片样本的识别间隔参数,包括:
根据各三元组图片样本的预设识别结果,确定三元组损失函数中所述各三元组图片样本对应的识别间隔参数。
在一个实施例中,所述各三元组图片样本包括:三张图片样本,其中,所述三张图片样本中有两张图片样本属于同类图片样本,剩余的一张图片样本属于异类图片样本;
所述根据各三元组图片样本的预设识别结果,确定三元组损失函数中所述各三元组图片样本对应的识别间隔参数,包括:
根据所述各三元组图片样本中异类图片样本的预设识别结果与所述同类图片样本的预设识别结果之间的预设识别差值,确定所述三元组损失函数中所述各三元组图片样本对应的识别间隔参数。
在一个实施例中,所述各三元组图片样本的预设识别差值越大,所述各三元组图片样本对应的识别间隔参数越大。
在一个实施例中,所述根据所述各三元组图片样本中异类图片样本的预设识别结果与所述同类图片样本的预设识别结果之间的预设识别差值,确定三元组损失函数中所述各三元组图片样本对应的识别间隔参数,包括:
根据预设损失阈值函数,确定所述各三元组图片样本对应的识别间隔参数,其中,所述预设损失阈值函数包括:
α=β*D+b
其中,α代表所述各三元组图片样本对应的识别间隔参数,D代表所述各三元组图片样本的预设识别差值,β为预设系数,b为预设偏置值。
在一个实施例中,所述当前识别结果包括当前识别的年龄,所述预设识别结果包括预设年龄,相应地,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710539510.X/2.html,转载请声明来源钻瓜专利网。