[发明专利]基于难样本挖掘的大规模人脸识别测试集构建方法及装置在审
申请号: | 202011595059.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112766049A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 鲁继文;朱政;周杰 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张文姣 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 挖掘 大规模 识别 测试 构建 方法 装置 | ||
1.一种基于难样本挖掘的大规模人脸识别测试集构建方法,其特征在于,包括以下步骤:
构建多个人物名称列表,将所述多个人物名称列表聚集在数据池中,并对所述数据池中的列表进行处理;
根据所述数据池中的人物名称,通过搜索引擎寻找人物名称对应的人脸;
将所述人物名称对应的人脸输入人脸识别模型中得到人脸相似度,根据相似度判断所述人脸是否为难样本,根据得到的难样本构建测试集。
2.根据权利要求1所述的方法,其特征在于,对所述数据池中的列表进行处理,包括:
对人物名称列表进行重复和冲突检测,将人物列表名称进行合并或删除。
3.根据权利要求1所述的方法,其特征在于,构建多个人物名称列表包括:通过多个标注者分别构建多个人物名称列表。
4.根据权利要求1所述的方法,其特征在于,所述人物名称列表包括多个属性特征标签。
5.根据权利要求1所述的方法,其特征在于,根据相似度判断所述人脸是否为难样本,包括:
若同一个人的人脸相似度小于0.5或不同人的人脸相似度大于0.5,则所述人脸为难样本。
6.一种基于难样本挖掘的大规模人脸识别测试集构建装置,其特征在于,包括:
第一构建模块,用于构建多个人物名称列表,将所述多个人物名称列表聚集在数据池中,并对所述数据池中的列表进行处理;
查找模块,用于根据所述数据池中的人物名称,通过搜索引擎寻找人物名称对应的人脸;
第二构建模块,用于将所述人物名称对应的人脸输入人脸识别模型中得到人脸相似度,根据相似度判断所述人脸是否为难样本,根据得到的难样本构建测试集。
7.根据权利要求6所述的装置,其特征在于,对所述数据池中的列表进行处理,包括:
对人物名称列表进行重复和冲突检测,将人物列表名称进行合并或删除。
8.根据权利要求6所述的装置,其特征在于,构建多个人物名称列表包括:通过多个标注者分别构建多个人物名称列表。
9.根据权利要求6所述的装置,其特征在于,所述人物名称列表包括多个属性特征标签。
10.根据权利要求6所述的装置,其特征在于,根据相似度判断所述人脸是否为难样本,包括:
若同一个人的人脸相似度小于0.5或不同人的人脸相似度大于0.5,则所述人脸为难样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011595059.1/1.html,转载请声明来源钻瓜专利网。