[发明专利]一种面向监控视频压缩的车辆对象多级知识字典构建方法有效

申请号：	201811418752.4	申请日：	2018-11-26
公开（公告）号：	CN109447037B	公开（公告）日：	2021-04-16
发明（设计）人：	胡瑞敏;陈宇;肖晶;朱荣;王中元;廖良;李登实	申请（专利权）人：	武汉大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/62
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	严彦
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向监控视频压缩车辆对象多级知识字典构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种面向监控视频压缩的车辆对象多级知识字典构建方法，用于监控视频中对象的表达和压缩，包括纹理层知识提取，所述纹理层知识包含多源监控视频中不同类型车辆的共性纹理，使用纹理字典对纹理层知识进行建模；结构层知识提取，所述结构层知识包含同一类型车辆的共性结构，使用三维模型对结构层知识进行建模；个性层知识提取，所述个性层知识包含某个车辆个体在一段时间内保持稳定的暂态知识，使用残差字典对其进行建模。本发明方法从纹理层、结构层以及个性层三个层次建立对象的多级知识字典，可更好表达复杂环境下运动对象在图像中的外观，且边缘细节等信息更加丰富，可提高监控车辆跟踪识别效率，能够广泛应用于智能交通等方面。

技术领域

本发明属于监控视频编码领域，特别涉及一种面向监控视频压缩的车辆对象多级知识字典构建方法，用于生成监控视频中运动对象的预测参考，提升监控视频的编码效率。

背景技术

近年来，城域监控网络已成为不可或缺的城市基础设施，在智能交通，智慧城市建设以及打击犯罪，维护公共安全等领域发挥着重要作用。然而，随着监控摄像机数目增多以及监控视频的高清化趋势，每日激增的海量监控视频数据对视频压缩效率提出严峻的挑战。

现有的监控视频压缩主要采用基于预测变换的混合编码框架，该框架通过帧内、帧间预测去除局部时空冗余，实现视频压缩的目的。然而，该框架主要针对单源视频独立压缩设计，且经过几十年研究，单源视频内的局部时空冗余已可较好去除，压缩效率提升达到瓶颈。

为了突破单源视频压缩方法的局限，多源视频压缩方法被提出。该方法利用同一运动对象在不同视频中的外观实质上是对象三维模型在二维图像上的投影这一特性，使用对象三维模型作为先验知识对运动对象进行预测，去除同一运动对象在不同视频中相似性导致的视频间冗余。然而，三维模型在建模时通常并未考虑人为装饰等物理因素以及光照等环境因素，这一类粗粒度的知识与真实视频中的对象存在较大差异，仅用三维模型预测对象，将导致较大预测残差，使得编码效率降低。在光照、天气等变化的复杂场景下，上述问题被进一步放大。

发明内容

为了解决上述的技术问题，本发明的目的在于：基于多源视频压缩的思想，从不同层次提取对象从粗到细粒度的知识，建立对象的多级知识字典，替换对象的三维模型，用于对象的表达，生成高精度的对象预测参考，提升编码效率。由于车辆对象具有刚性结构便于建模，因此本发明主要面向车辆对象。

为了达到上述目的，本发明的技术方案为一种面向监控视频压缩的车辆对象多级知识字典构建方法，用于监控视频中车辆对象的表达和压缩，包括以下步骤：步骤1.纹理层知识提取，所述纹理层知识包含多源监控视频中不同类型车辆的共性纹理，使用纹理字典对纹理层知识进行建模，包括以下子步骤，

步骤1.1.收集一段时间内，某一区域所有监控摄像机拍摄的多源监控视频数据，并进行视频分帧，逐帧对车辆区域进行分割，得到车辆图像；

步骤1.2.根据车辆图像的颜色均值，采用K-means方法进行聚类，其中聚类中心数K参照车辆常用颜色种类数进行设定；

步骤1.3.对于每一类车辆图像，从其中抽取图像块；

步骤1.4.将抽取的图像块作为样本，训练纹理字典作为纹理层知识；

步骤2.结构层知识提取，所述结构层知识包含同一类型车辆的共性结构，使用三维模型对结构层知识进行建模；

步骤3.个性层知识提取，所述个性层知识包含某个车辆个体在一段时间内保持稳定的暂态知识，使用残差字典对其进行建模，包括以下子步骤，

步骤3.1.从步骤1.1中得到的车辆图像中收集某一辆车的所有图像，使用纹理层与结构层知识进行表达，得到表达图像；

步骤3.2.将表达图像与原始车辆图像相减，得到残差图像；

步骤3.3.从残差图像中抽取图像块；