[发明专利]视频抽选方法、装置及存储介质有效
申请号: | 202010100697.5 | 申请日: | 2020-02-19 |
公开(公告)号: | CN110929706B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 刘杰辰;曹琼;郝玉峰;黄宇凯;李科 | 申请(专利权)人: | 北京海天瑞声科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/00;G06F16/783 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李英艳;李志新 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 抽选 方法 装置 存储 介质 | ||
本公开涉及一种视频抽选方法、装置及存储介质。其中,所述方法包括获取视频集,包括多个视频片段;得到视频片段的第一代表帧图片以及多张第二代表帧图片;获取第一代表帧图片特征向量和各第二代表帧图片特征向量,基于第一代表帧图片特征向量和各第二代表帧图片特征向量确定视频片段特征向量;获取视频片段与其他各视频片段之间的特征向量距离,基于各特征向量距离,得到视频片段的综合特征向量距离;于视频片段中选取第一数量个数的候选视频片段构成视频片段候选集,计算视频片段候选集中的候选视频片段的视频质量,并将视频质量最高的候选视频片段作为目标视频片段存入目标库。通过本公开的视频抽选方法,提高了采录目标人物的代表性。
技术领域
本公开涉及视频抽选技术领域,具体是涉及一种视频抽选方法、装置及存储介质。
背景技术
在计算机视觉针对人脸视频算法的训练中,需要采集大量人脸视频数据。在采集大批人脸数据过程中,难以避免地会出现人员重复采录的问题。在采录的不重复人员中,往往也会出现采录的人员在一定程度上存在相似特征的情况,使得采录的人员代表性不强。这将对后续的视频训练集制作以及视频模型训练造成干扰,降低训练效率。
发明内容
为了克服相关技术问题,本公开提供一种视频抽选方法、装置及存储介质。
第一方面,本公开实施例提供一种视频抽选方法,其包括:获取视频集,视频集包括多个视频片段,视频片段中包括目标人物;基于视频片段,得到视频片段的第一代表帧图片,以及根据第一代表帧图片确定的多张第二代表帧图片;获取第一代表帧图片的特征向量和各第二代表帧图片的特征向量,并基于第一代表帧图片的特征向量和各第二代表帧图片的特征向量确定视频片段的特征向量;分别获取视频片段与其他各视频片段之间的特征向量距离,并基于各特征向量距离,得到视频片段的综合特征向量距离;于视频片段中选取第一数量个数的候选视频片段构成视频片段候选集,其中,任一候选视频片段的综合特征向量距离大于任一其他视频片段的综合特征向量距离,第一数量个数的视频片段构成视频片段候选集,或于视频片段中选取候选视频片段构成视频片段候选集,其中,第一数量个数的视频片段的任一候选视频片段的综合特征向量距离均大于预设阈值;基于视频质量检测算法,计算视频片段候选集中的候选视频片段的视频质量,并将视频质量最高的候选视频片段作为目标视频片段存入目标库。
一种实施方式中,视频抽选方法还包括:判断目标库中存储的目标视频片段的数量是否超过数量阈值;若目标库中存储的目标视频片段的数量未超过数量阈值,则基于视频集中剩余的视频片段,选取得到目标视频片段存入目标库。
另一种实施方式中,基于视频集中剩余的视频片段,选取得到目标视频片段存入目标库,包括:分别获取视频集中剩余的视频片段与目标库中存储的各目标视频片段之间的特征向量距离,并基于视频集中剩余的视频片段与目标库存储的各目标视频片段之间的特征向量距离,得到视频集中剩余的视频片段的综合特征距离;选取第一数量个数的视频片段,其中,所述第一数量个数的视频片段的任一综合特征向量距离均大于其他所述视频集中剩余的视频片段的综合特征向量距离,所述第一数量个数的视频片段构成视频片段候选集于视频集中剩余的视频片段中选取第一数量个数的候选视频片段构成视频片段候选集,其中,任一候选视频片段的综合特征向量距离大于任一其他视频片段的综合特征向量距离,或于视频集中剩余的视频片段中选取候选视频片段构成视频片段候选集,其中,所述第一数量个数的视频片段的任一候选视频片段的综合特征向量距离均大于预设阈值;基于视频质量检测算法,计算视频片段候选集中的候选视频片段的视频质量,并将视频质量最高的候选视频片段作为目标视频片段存入目标库。
又一种实施方式中,基于视频片段,得到视频片段的第一代表帧图片,包括:基于视频片段,通过人脸检测,获取视频片段每帧视频帧画面的人脸信息;基于人脸信息,确定人脸面积最大的一帧视频帧画面,并将人脸面积最大的一帧视频帧画面作为第一代表帧图片;根据所述第一代表帧图片确定的多张第二代表帧图片,包括:基于第一代表帧图片,将人脸面积为第一代表帧图片中人脸面积的第一预设倍数的视频帧画面作为第二代表帧图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海天瑞声科技股份有限公司,未经北京海天瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010100697.5/2.html,转载请声明来源钻瓜专利网。