[发明专利]基于迁移学习和视频帧关联学习的视频分析方法有效
申请号: | 201510112142.1 | 申请日: | 2015-05-22 |
公开(公告)号: | CN110148105B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 袁媛;卢孝强;牟立超 | 申请(专利权)人: | 中国科学院西安光学精密机械研究所 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/764;G06V10/778 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 倪金荣 |
地址: | 710119 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于迁移学习和视频帧关联学习的视频内容分析方法,主要解决了现有视频内容分析方法需要大量人工标记以及视频分析中存在“黑洞”现象的问题。其实现步骤是:(1)依据运动预测和光流分析算法对标签进行视频帧之间的迁移;(2)利用现有的图像标注数据集对上述步骤中产生的“黑洞”现象进行跨媒体迁移学习;(3)利用马尔科夫随机场模型对单幅视频帧中对象空间分布进行先验知识建模;(4)在最大后验概率模型下将以上三步统一求解,得到最终的视频分析结果。本发明充分利用了视频中空‑时域信息,迁移学习方法将大规模的已标注图像数据信息迁移到视频域对“黑洞”进行补绘,从而取得更精准的视频内容的像素级自动标注结果。 | ||
搜索关键词: | 基于 迁移 学习 视频 关联 分析 方法 | ||
【主权项】:
1.一种基于迁移学习和视频帧关联学习的视频内容分析方法,其特征在于:包括以下步骤:(1)利用运动估计和光流场估计进行视频帧关联学习;(1a)计算前向映射函数,并以此为据,对下一帧的标签进行估计;其中,代表视频中第t帧的第i个超像素,L(·)表示超像素的类别信息,而f(·)为前向映射函数;(1b)计算反向映射函数,并以此为据,对上一帧的标签进行交叉验证;(1c)以(1a)和(1b)步骤得到的结果,构造能量函数,如下:通过上式得到视频的标签信息,其中包括某些像素无标签信息;(2)对步骤(1)产生的某些像素无标签信息,利用跨媒体迁移学习进行补绘,分为以下两种方法:(2a)基于近邻匹配的策略;对某些像素无标签信息区域进行视觉特征信息提取,然后利用K近邻在已标注的图像数据库中进行相似度计算,选取前K最近邻,将类别标签赋予像素无标签信息区域;具体可以表示为如下目标式:式中表示黑洞区域,si表示已知标签信息的图像区域;(2b)基于分类器的迁移策略。在已有的大规模图像标注数据集上对每类对象提取颜色统计特征、均值、方差量化指标以及LBP纹理特征等特征训练分类器,本方法中采用SVM分类器,然后对“黑洞”区域进行与上述相同的特征提取,再利用已训练好的分类器对其类别进行判断,进而确定其类别标签;分类器的训练方法如下:式中wi为系数矩阵,bi为偏移项;(3)将步骤(1)和步骤(2)中得到的函数公式相加,得到最终的目标优化函数式,然后在最大后验概率框架下进行统一优化求解;目标优化函数式可以归结为以下公式:其中,ct为第t帧的类别标签图;p(.)代表概率分布;根据贝叶斯公式,对上式的一系列等价变换,最终得到最终的求解形式:式中si为第i个区域,ci为第i个区域的类别标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院西安光学精密机械研究所,未经中国科学院西安光学精密机械研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510112142.1/,转载请声明来源钻瓜专利网。