[发明专利]一种基于深度学习的低维人脸模型训练方法在审
申请号: | 201710884185.0 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107633232A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 刘梅;周春燕;刘明华 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 四川省成都市天策商标专利事务所51213 | 代理人: | 刘兴亮,刘渝 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 低维人脸 模型 训练 方法 | ||
技术领域
本发明涉及一种人脸模型训练方法,具体涉及一种基于深度学习的低维人脸模型训练方法,属于计算机视觉技术领域。
背景技术
人脸识别技术是指对输入的人脸图像进行人脸位置确定,并进一步确认每个人脸的身份信息。该研究是人工智能,视觉感知的热门研究课题,已经广泛应用于人机交互、社会安全,移动支付等领域。
人脸识别在技术上因为深度学习的进步以及硬件资源的更新已经有了质的飞跃,在标准测试库(LFW)上的识别率已赶超人类。但大多数效果良好的深度学习模型都是基于多网络深网络,针对特定的测试库。因此在实时应用时,存在效率低下,不能适应各种变换场景的问题。
目前基于卷积神经网络的模型训练,训练样本集大多来自于网络爬虫搜索,样本不够丰富(光线,姿态,遮挡,分辨率),样本分布不够广泛。在训练过程中,随机选择小批量图像进行模型参数更新,随机性太强,得到的模型不够鲁棒。
发明内容
本发明提供了一种基于深度学习的低维人脸模型训练方法。设计了一种轻量型的单网络,在同样的训练库下,该方法可以实现人脸识别率的大幅提升,且人脸特征仅有256维。
本发明所采用的技术方案是:
基于深度学习的低维人脸模型训练方法,包括如下步骤:
步骤s1:采集人脸图像并作对齐处理,构造训练样本集;
步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型;
步骤s3:利用初始模型对训练样本打分,随机挑选基准样本,并根据基准样本挑选正负样本的难例样本集;
步骤s4:将步骤s3得到的难例进一步丰富化,将丰富后的难例样本组合在一起,作为后续训练的难例集;
步骤s5:精调模型:利用难例集精调模型,将s2中的初始训练模型用于初始化新模型,不断迭代训练直到模型收敛;
进一步的所述步骤s2的步骤包括:构建的轻量型网络包括5个卷积层,4个最大池化层,2个全连接层,提取人脸特征的模型包含大约4M个参数;
所述步骤s3的步骤包括:
s31:利用步骤s2得到的模型提取训练样本集里的人脸特征,将第一个全连接层的256维输出作为低维的人脸特征;
s32:计算余弦距离,选取难例,与基准样本是同一个人的,选取原则是,选择距离远的样本;而不是同一人的样本,则选取距离近的样本;
所述步骤s4的步骤包括:
s41:难例样本的丰富化包括增加面部光线,按人脸关键点的位置计算人脸的面部亮度,如果亮度较暗,提升人脸面部亮度,如果亮度亮,则降低亮度,并保存为新的样本;
s42:提高、降低图像分辨率到原始训练样本大小的一倍、一半。
所述步骤s5的步骤包括:将每个人的难例样本以及丰富后的样本组合在一起,构建难例batch,每个人挑选的难例batch个数要保持一致。
本发明相比现有技术具有以下优点,轻量型单网络模型具有参数少,提取的特征维数低,效率高的优点。传统训练方法没有设置难例样本集,是将所有样本直接加入模型训练,而难例样本集在训练的迭代优化中,对模型进行约束,使模型对相同人和不同人的样本有更强的辨识能力。难例的样本丰富化使得模型对环境的变化鲁棒性更强。
附图说明
图1为本发明方法流程图;
图2部分正难例;随机挑选一个基准样本,图2中选定org董璇.GIF为当前基准样本,利用初始模型测试董璇这个分类下的所有正样本与基准样本的距离,选取距离远的样本为正难例;
图3部分负难例。根据图2所示,选定org董璇.GIF为当前基准样本,利用初始模型对所有非董璇类训练样本打分,选取距离org董璇.GIF较近的负样本为负难例。
具体实施方式
下面结合实施例与附图对本发明进行详细描述:
本发明主要应用于深度卷积神经网络的模型训练,应用于人脸识别率的提升,具体实施步骤如下:
实施例1
本实施例提供了一种深度卷积神经网络的模型训练方法,如图1所示,具体包括以下步骤:
步骤s1:采集亚洲人脸图像,对图像做预处理,包括人脸检测,关键点检测,人脸对齐,构造训练样本集;
步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型。构建的轻量型网络包括5个卷积层,4个最大池化层,2个全连接层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710884185.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸检测方法及相关产品
- 下一篇:一种智能车牌识别方法