[发明专利]人脸识别模型的训练方法、装置、系统和计算机可读介质有效
申请号: | 201910516876.4 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110414550B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 王塑;王泽荣;杜佳慧;刘宇;李亮亮;肖琳 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06V40/16;G06K9/62 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 董巍;高伟 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 模型 训练 方法 装置 系统 计算机 可读 介质 | ||
本发明提供了一种人脸识别模型的训练方法、装置、系统和计算机可读介质,该人脸识别模型的训练方法包括:在每个批次中将N组图片输入神经网络,得到每张图片所对应的特征向量,其中,所述N组图片中的每组图片属于同一类别,N为大于或等于1的自然数;基于所述特征向量计算每组图片的类内距离,并根据所述类内距离计算第一损失函数,用于监控所述类内距离的分布差异;计算第二损失函数,并与所述第一损失函数加权,以得到总损失函数;以及优化所述总损失函数,以使之收敛。本发明在训练过程中引入类内距离分布差别损失函数,规整了类内距离的分布,能够解决由于不同数据集分布差异导致阈值难以统一的问题。
技术领域
本发明涉及人脸识别技术领域,更具体地涉及一种人脸识别模型的训练方法、装置、系统和计算机可读介质。
背景技术
目前的人脸识别任务主要分为三类,即人脸验证(验证是否为同一人)、人脸识别(找到查询人脸图片与很多目标人脸图片中最相近的人)和聚类(目标人脸图片,将其分为看起来相互之间最像的几种)。通常采用的方法是通过训练深度网络模型将人脸图片转化到特征空间中的点,并使得在特征空间中,距离近的点对应的人脸最像同一个人,距离远的对应为不同的人。那么,人脸验证任务等价于计算特征空间中点的距离是否小于阈值;人脸识别等价于寻找与查询人脸图片对应点最近的目标人脸图片对应点;聚类则等价于使用k-means方法的聚类算法。在此基础上,人脸识别任务等价于训练一个好的深度网络模型,将人脸图片转化到特征空间。
现在普遍使用的方法包括两类学习方案,三元组学习方案(triplet)和分类学习方案(classification)。人脸识别模型在训练结束后,需要设定阈值,当两张图片的距离大于阈值则判定为不是同一个人,小于阈值时则判定为是同一个人。但当前的模型在不同数据集上存在显著的阈值差异。例如,当模型使用全人种数据集训练后,由于黄种人的人脸图片可区分度更大,黑人的人脸图片更难区分,使用黄种人数据集确定的阈值显著大于使用黑人确定的阈值。多数据集阈值不对齐导致选定阈值后,在特定的数据上的误通过率很低、误拒绝率很高,而再另一些数据集上误通过率很高、误拒绝率很低,破坏模型的整体表现。
发明内容
为了解决上述问题,本发明提出了一种基于类内距离分布对齐的人脸识别模型的训练方案。下面简要描述本发明提出的关于人脸识别模型的训练方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明实施例一方面,提供了一种人脸识别模型的训练方法,所述方法包括:在每个批次中将N组图片输入神经网络,得到每张图片所对应的特征向量,其中,所述N组图片中的每组图片属于同一类别,N为大于或等于1的自然数;基于每组图片的所述特征向量计算每组图片的类内距离,并根据所述类内距离计算第一损失函数,所述第一损失函数用于监控所述类内距离的分布差异;计算第二损失函数,并与所述第一损失函数加权,以得到总损失函数;以及优化所述总损失函数,以使之收敛。
在一个实施例中,所述第一损失函数关注所述类内距离的均值和/或标准差的趋同。
在一个实施例中,所述第一损失函数表示为:L=abs(mean(di)-R)+abs(std(di)-S),其中,di为每个批次中的类内距离,mean表示均值,std表示标准差,R和S为待学习参数,分别表示所述类内距离的总体均值和总体标准差,abs为绝对值函数。
在一个实施例中,所述第一损失函数表示为:L=F3(abs(mean(F1(di))-R))+F4(abs(std(F2(di))-S)),其中F1、F2是单调函数,F3、F4是正相关函数,di为每个批次中的类内距离,mean表示均值,std表示标准差,R和S为待学习参数,分别表示所述类内距离的总体均值和总体标准差,abs为绝对值函数。
在一个实施例中,F3为0。
在一个实施例中,采用随机梯度下降方法优化所述总损失函数。
在一个实施例中,所述每组图片为针对同一个人的两张图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910516876.4/2.html,转载请声明来源钻瓜专利网。