[发明专利]一种人物图片筛选方法及装置有效
申请号: | 201910576454.6 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110287361B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 韩冰 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/55 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;高莺然 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人物图片 筛选 方法 装置 | ||
本发明实施例提供了一种人物图片筛选方法及装置,其中,该方法包括:针对待筛选的多个人物图片中的每个人物图片,对该人物图片进行人脸置信度检测,得到该人物图片的人脸置信度,人脸置信度表示该人物图片中具有人脸区域的程度,当人脸置信度大于预设置信度阈值时,获取该人物图片中人脸区域的人脸长度和人脸宽度,基于人脸长度与预设长度阈值的比较结果,以及人脸宽度与预设宽度阈值的比较结果,确定该人物图片是否作为待选择的人物图片,从所述多个人物图片中的全部待选择的人物图片中,筛选出待标注的人物图片;本发明实施例可以过滤掉不存在人脸区域的图片,也可以过滤掉人脸形状不满足要求的图片,从而减少了标注的工作量。
技术领域
本发明涉及多媒体识别技术领域,特别是涉及一种人物图片筛选方法及装置。
背景技术
目前,需要对与人物身份匹配的图片标注人名,而现有常用的方式一般是依据人名从互联网爬取大量的图片,得到指定人物对应的图片库,然后再对指定人物对应的图片库中的图片进行人工标注;其中,标注的具体过程如下:先对指定人物对应的图片库中的图片进行逐一筛选审核,然后对筛选审核后得到的与指定人物相匹配的标准图进行标注。
发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
由于爬取的原始数据比较粗糙,爬取得到的指定人物对应的图片中有很多不适合作为标准图或者与指定人物不匹配的图片,直接进行人工标注,导致标注工作量比较大,标注效率比较低。
发明内容
本发明实施例的目的在于提供一种人物图片筛选方法及装置,用以解决标注工作量比较大以及标注效率比较低的问题。具体技术方案如下:
本发明实施例提供了一种人物图片筛选方法,其包括:
针对待筛选的多个人物图片中的每个人物图片,对该人物图片进行人脸置信度检测,得到该人物图片的人脸置信度,所述人脸置信度表示该人物图片中具有人脸区域的程度;
当所述人脸置信度大于预设置信度阈值时,获取该人物图片中人脸区域的人脸长度和人脸宽度;
基于所述人脸长度与预设长度阈值的比较结果,以及所述人脸宽度与预设宽度阈值的比较结果,确定该人物图片是否作为待选择的人物图片;
从所述多个人物图片中的全部待选择的人物图片中,筛选出待标注的人物图片。
可选的,所述基于所述人脸长度与预设长度阈值的比较结果,以及所述人脸宽度与所述预设宽度阈值的比较结果,确定该人物图片是否作为待选择的人物图片,包括:
当所述人脸长度不大于预设长度阈值,且所述人脸宽度不大于预设宽度阈值时,确定该人物图片作为待选择的人物图片。
可选的,所述基于所述人脸长度与预设长度阈值的比较结果,以及所述人脸宽度与所述预设宽度阈值的比较结果,确定该人物图片是否作为待选择的人物图片,包括:
当所述人脸长度不大于预设长度阈值,且所述人脸宽度不大于预设宽度阈值时,提取该人物图片的人脸特征,得到该人物图片的人脸特征向量;
计算所述人脸特征向量的二范数,所述人脸特征向量的二范数表示该人物图片的清晰程度;
基于所述人脸特征向量的二范数与预设二范数阈值的比较结果,确定该人物图片是否作为待选择的人物图片。
可选的,所述基于所述人脸特征向量的二范数与预设二范数阈值的比较结果,确定该人物图片是否作为待选择的人物图片,包括:
当所述人脸特征向量的二范数大于所述预设二范数阈值时,确定该人物图片作为待选择的人物图片。
可选的,所述基于所述人脸特征向量的二范数与预设二范数阈值的比较结果,确定该人物图片是否作为待选择的人物图片,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910576454.6/2.html,转载请声明来源钻瓜专利网。