[发明专利]基于深度学习的人脸识别网络训练方法、设备及存储介质在审
申请号: | 201810459296.1 | 申请日: | 2018-05-15 |
公开(公告)号: | CN110490028A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 王标;史方;邹佳运;郭宏 | 申请(专利权)人: | 成都视观天下科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 51214 成都九鼎天元知识产权代理有限公司 | 代理人: | 徐静<国际申请>=<国际公布>=<进入国 |
地址: | 610041 四川省成都市高新区天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似度 卷积神经网络 参数修正 代价函数 人脸识别 网络模型 人脸 神经网络训练 存储介质 距离缩小 距离增大 类间距离 类内距离 人脸特征 收敛条件 网络训练 优化算法 总误差 卷积 算法 网络 更新 学习 | ||
1.一种基于深度学习的人脸识别网络训练方法,其特征在于包括:
将所有图像做人脸对齐操作,制作训练数据;
根据训练数据进行卷积神经网络训练,得到卷积神经网络的代价函数J;
对上述代价函数J通过类内相似度J1、类间相似度J2进行参数修正,得到总误差函数Js=J+γJ1-θJ2;
通过代价函数J的残差值、类内相似度J1的残差值和类间相似度J2的残差值求偏导后反向传播,卷积神经网络中每一层的权值参数的得到更新;然后正向传播过程中,分别对应卷积神经网络中代价函数J、类内相似度J1、类间相似度J2的更新收敛;当总误差函数Js满足收敛条件,则完成卷积神经网络训练。
2.根据权利要求1所述的网络训练方法,其特征在于所述类内相似度J1的残差值计算过程为:
其中设m样本组成的样本集为{(x(1),y(1)),…,(x(m),y(m))},m为所有待输入样本的数量,它们分属于n个类别每个类别对应的相同数量的样本,即每个类别有m/n个样本;hW,b(x(k,a))是从属于α类的第k个样本计算得到的卷积神经网络最后一层的输出,M(a)为第α类样本的均值,α属于n,k范围1到m/n。
3.根据权利要求1所述的网络训练方法,其特征在于所述类间相似度J2的残差值计算过程:
其中,hW,b(x(k,β))是从属于β类的第k个样本计算得到的卷积神经网络最后一层的输出,M(β)分别为第β类样本的均值,β属于n。
4.根据权利要求1所述的网络训练方法,其特征在于所述代价函数J的残差值
5.基于权利要求1至4之一所述训练方法的人脸识别方法,其特征在于还包括:
待识别图像输入到训练好的卷积神经网络进行人脸图像识别。
6.一种存储介质,其中存储有多条指令,所述指令适用于由处理器加载并执行如权利要求1至4任意一项所述的网络训练方法的步骤。
7.一种存储介质,其中存储有多条指令,所述指令适用于由处理器加载并执行如权利要求5述的人脸识别方法的步骤。
8.一种基于深度学习的人脸识别网络训练设备,其特征在于包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行上述权利要求1至4任意一项所述的网络训练方法。
9.一种人脸识别设备,其特征在于包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行上述权利要求5任意一项所述的人脸识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都视观天下科技有限公司,未经成都视观天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810459296.1/1.html,转载请声明来源钻瓜专利网。