[发明专利]特征提取网络的训练方法、人脸识别方法和装置在审
申请号: | 202110086798.6 | 申请日: | 2021-01-22 |
公开(公告)号: | CN113762019A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 王军;石海林;王林芳;梅涛;周伯文 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;臧建明 |
地址: | 100176 北京市经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 提取 网络 训练 方法 识别 装置 | ||
1.一种特征提取网络的训练方法,其特征在于,包括:
对人脸数据库中的样本进行聚类,得到多个训练组,每个训练组中的样本较为相似;
从M个训练组中采样M个样本,M为训练批次的大小,每个训练组中选择一个样本;
从所述M个训练组中获取所述M个样本的两张图片,组成第一训练队列和第二训练队列,所述第一训练队列和所述第二训练队列中分别包括所述M个样本的一张图片;
将所述第一训练队列输入第一特征提取网络,将所述第二训练队列输入第二特征提取网络;
根据正样本对的特征相似度以及负样本对的特征相似度计算损失函数,其中,所述第一特征提取网络和所述第二特征提取网络提取的同一个样本的特征组成一个正样本对,所述第一特征提取网络提取的特征和特征队列中的特征组成负样本对,所述特征队列用于存储所述第二特征提取网络提取的之前训练批次的样本的特征;
根据所述损失函数更新所述第一特征提取网络的参数;
根据所述第一特征提取网络的更新后的参数,采用动量参数更新方法更新所述第二特征提取网络的参数;
在所述训练批次训练结束后,将所述第二特征提取网络提取到的特征更新到所述特征队列中;
从所述多个训练组中采样得到下一个训练批次,执行上述训练过程直至所述人脸数据库中的所有样本都被训练一次,则结束当前训练周期。
2.根据权利要求1所述的方法,其特征在于,所述对人脸数据库中的样本进行聚类,得到多个训练组,包括:
采用所述人脸数据库中的部分数据预先训练得到第三特征提取模型;
采用所述第三特征提取模型提取所述人脸数据库中的所有图片的特征;
根据所述人脸数据库中的所有图片的特征对所述人脸数据库中的样本进行聚类,得到所述多个训练组。
3.根据权利要求2所述的方法,其特征在于,所述根据正样本对的特征相似度以及负样本对的特征相似度计算损失函数,包括:
通过如下公式计算所述损失函数:
其中,Loss表示所述损失函数,M表示所述训练批次的大小,feati1表示所述M个样本中第i个样本通过所述第一特征提取网络提取到的特征,feati2表示所述M个样本中第i个样本通过所述第二特征提取网络提取到的特征,m为特征间隔,s为缩放系数,K表示所述特征队列的大小,featj表示所述特征队列中的第j个特征,M、m、s和K均为预先设置的固定值,.用于计算两个特征的相似度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征提取网络的更新后的参数,采用动量参数更新方法更新所述第二特征提取网络的参数,包括:
根据如下公式更新所述第二特征提取网络的参数:
θ2=mθ2+(1-m)θ1
其中,θ2表示所述第二特征提取网络的参数,θ1表示所述第一特征提取网络的参数,m为动量,m的取值为大于0且小于1。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述训练批次训练结束后,将所述第二特征提取网络提取到的特征更新到所述特征队列中,包括:
当所述特征队列未溢出时,将所述第二特征提取网络提取到的特征插入上一训练批次对应的特征之后;或者,
当所述特征队列溢出时,从所述特征队列中删除最早插入的M个特征,将所述第二特征提取网络提取到的特征插入上一训练批次对应的特征之后。
6.根据权利要求5所述的方法,其特征在于,当所述人脸数据库中所有样本都被训练一次之后,清空所述特征队列,进入下一个训练周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086798.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:口罩装置
- 下一篇:彩钢桥架自动化生产设备