[发明专利]数据压缩的方法、装置、设备及存储介质在审
申请号: | 202010604773.6 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111918071A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 马思伟;黎吉国;贾川民;赵政辉;王苫社 | 申请(专利权)人: | 北京大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;G06F40/30 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据压缩 方法 装置 设备 存储 介质 | ||
本发明公开了一种数据压缩的方法、装置、设备及存储介质,包括:将数据从高语义冗余的域压缩到低语义冗余的域,得到以自然语义形式表述的压缩数据,对所述压缩数据进行有损编码或无损编码,得到编码后的压缩数据,对所述编码后的压缩数据进行解码,得到可用自然语义形式表述的低语义冗余数据,对所述可用自然语义形式表述的低语义冗余数据进行解压,得到高语义冗余数据。本发明公开的数据压缩方法,将高语义冗余的数据压缩到低语义冗余的数据,不仅实现数据的压缩,而且重点优化数据的语义层面的保真,得到的压缩数据是以自然语义形式表述的人可以理解的数据,可以面向一个或多个机器分析任务,还可以应用于语义监控的场景中。
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据压缩的方法、装置、设备及存储介质。
背景技术
传统的数据压缩框架主要是信号层面的保真和人眼观看的主观保真,但是,近些年来逐渐增多的机器分析的应用场景主要要求数据的语义层面的保真,因此,随着近些年机器分析任务逐渐应用到生产生活中,传统的压缩框架不能在机器分析的应用场景下达到最优。
现有技术中提出的面向机器分析的压缩框架包括终层特征压缩框架和中间层特征压缩框架,终层特征压缩框架压缩和传输神经网络最终层的特征,使用先分析,再压缩传输的方式,在摄像机前端进行几乎所有的分析计算,然后将分析层前一层的特征向量压缩传输到计算中心,在计算中心得到最终的分析结果,这种压缩方式的好处在于,大大减轻了计算中心的负载,将分析任务的负载分布式的放在了前端设备上,这种压缩方式也有严重的缺点,它使用的特征向量是任务特异的,只能在计算中心应用于一个任务。当我们希望在计算中心得到多个分析结果时,就需要压缩传输多个特征向量。
中间层特征压缩使用网络的中间层特征,而不是最终层,利用中间层特征任务特异性较弱的特点,使得压缩和传输的特征向量可以在计算中心得到多个任务的分析结果,同时,可以通过调整特征向量所在中间层的位置,可以合理分配分析任务在前端和计算中心的负载,这种压缩方式的缺点是,特征向量不是人可以理解的。在语义监控场景中,即我们需要实时监控数据的某些语义信息,而不是原始数据,这种中间层特征压缩方式将无法满足需求。
发明内容
本公开实施例提供了一种数据压缩的方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本公开实施例提供了一种数据压缩的方法,包括:
将数据从高语义冗余的域压缩到低语义冗余的域,得到以自然语义形式表述的压缩数据。
进一步地,得到以自然语义形式表述的压缩数据之后,还包括:
对压缩数据进行有损编码或无损编码,得到编码后的压缩数据。
进一步地,得到编码后的压缩数据之后,还包括:
对编码后的压缩数据进行解码,得到可用自然语义形式表述的低语义冗余数据;
对可用自然语义形式表述的低语义冗余数据进行解压,得到高语义冗余数据。
进一步地,将数据从高语义冗余的域压缩到低语义冗余的域,得到以自然语义形式表述的压缩数据,包括:
根据预先训练的自然语义描述模型,将数据从高语义冗余的域压缩到低语义冗余的域,得到以自然语义形式表述的压缩数据。
进一步地,高语义冗余的域,包括以下中的一种或多种:
图像域、视频域以及点云数据域。
进一步地,低语义冗余的域,包括以下中的一种或多种:
文本域、边缘图域、语义图域以及属性表域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010604773.6/2.html,转载请声明来源钻瓜专利网。