[发明专利]一种基于视频时空上下文的视频人物关系分析方法在审

申请号：	202110946018.0	申请日：	2021-08-18
公开（公告）号：	CN113642482A	公开（公告）日：	2021-11-12
发明（设计）人：	张顺;梅少辉;李昌跃;王茹	申请（专利权）人：	西北工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	西北工业大学专利中心 61204	代理人：	金凤
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于视频时空上下文人物关系分析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于视频时空上下文的视频人物关系分析方法，其特征在于，包括以下步骤：

步骤1：对视频数据进行预处理，将视频镜头和场景进行切分，提取人物特征和聚类：

步骤1-1：在包含人脸类别的离线人脸数据集上，使用监督式方法预训练人脸CNN模型；

步骤1-2：检测视频中的镜头切换，将视频分成多个无重叠的镜头片段；对视频每帧图像使用人脸检测器检测人脸目标，在每个镜头片段中关联人脸检测响应生成可靠的轨迹片段；根据轨迹片段间的限制信息，自动生成大量的正负训练样本；

步骤1-3：正负训练样本以三元组的方式训练改进的Triplet网络，在线学习判别性人脸特征；训练过程中，改进的Triplet网络使用预训练的人脸CNN模型进行参数初始化；

步骤1-4：对每个检测响应求解目标身份；在每个镜头片段中，结合人脸目标的外观及运动信息使用基于概率图模型的多目标数据关联算法；

步骤1-5：使用层次化合并聚类算法关联不同镜头片段中的轨迹片段，形成最终的目标轨迹；

步骤2：根据步骤1预处理的结果使用基于上下文高斯加权的方法计算人物在视频镜头的共生关系；

步骤3：根据空间位置对视频人物关系的影响，融合时空上下文建立人物关系模型；

步骤4：根据人物关系模型绘制人物关系图。

2.根据权利要求1所述的一种基于视频时空上下文的视频人物关系分析方法，其特征在于，所述步骤1-1中使用的深度卷积神经网络是残差网络ResNet-50神经网络，同时使用sigmoid损失函数进行监督式训练学习人脸目标的判别特征；学习的离线人脸数据集是VGG-Face2人脸识别数据集。

3.根据权利要求2所述的一种基于视频时空上下文的视频人物关系分析方法，其特征在于，所述步骤1-2生成大量的正负训练样本的具体方法为：

步骤1-2-1：利用镜头自动分割方法检测视频中所有的镜头切换，再将待处理的视频划分成多个无重叠的镜头片段；

步骤1-2-2：利用人脸检测器，对视频每一帧图像进行人脸检测，生成人脸检测响应集X＝{x₁，...，x_R}，其中R是生成所有检测响应的数目；

步骤1-2-3：从单摄像机数据关联生成的高置信度轨迹片段T＝{T¹，...，T^M}中，挖掘视频上下文时空约束信息，并收集训练样本，其中是长度为n_i的第i^th个人脸轨迹片段，M为轨迹片段总数；

步骤1-2-4：利用两种时空限制信息：(1)属于同一类别的约束信息：同一个轨迹片段上的所有检测响应判定为属于同一个类别；(2)属于不同类别的约束信息：当两个轨迹片段在同一帧图像上同时出现时，这两个轨迹片段各自的检测响应属于不同类别；根据从待跟踪的视频中发现的时空约束信息，在线生成大量的人脸正负训练样本；

定义矩阵H∈R^M×M，如果两个轨迹片段Tⁱ和T^j在某一时刻同时出现，矩阵的元素H_i，j取值为1，否则的话H_i，j＝0；根据属于同一类别的约束信息，收集正样本集P⁺：

根据属于不同类别的约束信息，收集负样本集N^-：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110946018.0/1.html，转载请声明来源钻瓜专利网。

上一篇：识别方法、训练方法、装置、电子设备以及存储介质
下一篇：一种汽车转向轴承套圈实验机

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于视频时空上下文的视频人物关系分析方法在审

专利文献下载