[发明专利]一种视频人脸标记方法在审
申请号: | 201811141277.0 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109472197A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 张一帆 | 申请(专利权)人: | 中国科学院自动化研究所;中国科学院自动化研究所南京人工智能芯片创新研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孟德栋 |
地址: | 100089 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标记视频 无向图 人脸标记 人脸图像 视频人脸 人脸 匹配 文本 时间信息 申请 转化 | ||
本发明实施例提出的一种视频人脸标记方法,根据待标记视频和与待标记视频对应的文本中分别计算人脸图像和人名的出现频次,建立人脸关系网和人名关系网。然后将人脸关系网和人名关系网分别转化为无向图,通过对两个无向图进行匹配的方法在两个无向图的顶点之间建立对应关系,以实现对待标记视频中的人脸图像进行标记。本申请提供的人脸标记方法,通过将待标记视频和与待标记视频对应的文本进行图匹配,实现了待标记视频中的人脸标记,摆脱了对时间信息的要求。
技术领域
本发明实施例涉及人脸标记技术领域,具体涉及一种视频人脸标记方法。
背景技术
随着电影工业的蓬勃发展,大批的电影相继制作产生。对于海量电影视频数据的索引、组织和管理也变得越来越重要。在电影中,由于情节皆是围绕人物展开的,因此人物通常是观众关注的焦点,所以人物是电影中需要标注和索引的重要内容。
现有的人脸标记技术以往主要应用于新闻视频,因为在新闻视频中,可以在通过语音转录的文本中获取大量人名,而且该转录文本与视频在时间上是自动对齐的,可以根据时间的一致性实现人脸与人名的关联。这种方法可以称为“局部匹配”。然而在电影视频中,局部匹配却并不适用。这是因为电影人物的对话中并不经常出现人名,所以从语音转录文本中无法提取到足够的人名。在电影剧本中,虽然包含有人物的姓名,但是却没有时间信息,无法将剧本与视频在时间上进行对齐,即无法采用局部匹配来实现人脸与人名的匹配。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供了一种视频人脸标记方法。
有鉴于此,第一方面,本发明实施例提供一种视频人脸标记方法,其特征在于,包括:
获取待标记视频中的人脸图像序列;
根据所述人脸图像序列建立人脸关系网;
获取与所述待标记视频对应的文本中的人名;
根据所述人名构建人名关系网;
分别将所述人脸关系网和所述人名关系网转化为人脸无向图和人名无向图;
对所述人脸无向图和人名无向图进行匹配,得到待标记视频中人脸图像的标记结果。
可选的,所述获取待标记视频中的人脸图像序列,包括:
采用多视角的人脸检测与跟踪器自动获取待标记视频中的人脸图像序列。
可选的,根据所述人脸图像序列建立人脸关系网,包括:
采用搬土距离算法计算人脸图像序列间的距离;
根据所述人脸图像序列间的距离采用凝聚层次聚类算法对所述人脸图像序列进行聚类,得到人脸簇;
统计每一个人脸簇在所述待标记视频的各个场景中出现的频次;
根据任意两个人脸簇在所述待标记视频的各个场景中分别出现的频次,计算所述任意两个人脸簇在所述待标记视频的各个场景中共同出现的频次;
根据所述任意两个人脸簇在所述待标记视频的各个场景中共同出现的频次构建人脸关系网。
可选的,获取与所述待标记视频对应的文本中的人名,包括:
采用命名实体识别算法识别出所述文本中的人名。
可选的,根据所述人名构建人名关系网,包括:
统计每一个人名在所述文本的各个场景中出现的频次;
根据任意两个人名在所述文本的各个场景中分别出现的频次,计算所述任意两个人名在所述文本的各个场景中共同出现的频次;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;中国科学院自动化研究所南京人工智能芯片创新研究院,未经中国科学院自动化研究所;中国科学院自动化研究所南京人工智能芯片创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811141277.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视频图像的室内人员检测方法
- 下一篇:一种姿态鲁棒的视频笑脸识别方法