[发明专利]局部熵编码的数据压缩在审
申请号: | 201980013816.9 | 申请日: | 2019-05-15 |
公开(公告)号: | CN111727445A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | D.C.米南;M.科韦尔;S.辛格;S.J.黄;G.D.托德里西 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 局部 编码 数据压缩 | ||
1.一种用于压缩数据的系统,所述系统包括:
编码器神经网络,被配置为执行操作,所述操作包括:
接收要压缩的数据;
根据一组编码器神经网络参数的当前值处理数据,以生成包括作为代码符号的有序集合的数据的表示的输出;
压缩子系统,被配置为执行操作,所述操作包括:
接收编码器神经网络的输出,所述编码器神经网络的输出包括作为代码符号的有序集合的数据的表示;
识别代码符号的集合到一个或多个代码符号子集的划分;
对于每个代码符号子集:
从多个代码符号概率分布的字典中,并且基于代码符号子集,
识别代码符号子集的代码符号概率分布;
通过使用为代码符号子集识别的代码符号概率分布对代码符号子集进行熵编码,生成代码符号子集的熵编码表示;
确定代码符号子集的压缩表示,所述压缩表示包括:(i)代码符号子集的熵编码表示,和(ii)指示用于对代码符号子集进行熵编码的代码符号概率分布的数据;
基于代码符号子集的压缩表示来确定数据的压缩表示。
2.根据权利要求1所述的系统,其中,所述要压缩的数据包括图像。
3.根据权利要求1-2中任一项所述的系统,其中,所述编码器神经网络是卷积神经网络。
4.根据权利要求1-3中任一项所述的系统,还包括被配置为执行操作的学习子系统,所述操作包括:
由编码器神经网络并且根据所述一组编码器神经网络参数的当前值处理一组训练数据中的数据,以生成包括所述一组训练数据中的数据的表示的、作为代码符号的有序集合的输出;
对于代码符号的每个有序集合,识别代码符号的有序集合到一个或多个代码符号子集的划分;以及
基于代码符号的有序集合的代码符号子集中的代码符号的分布,确定多个代码符号概率分布的字典。
5.根据权利要求4所述的系统,其中,确定代码符号概率分布的字典包括:
对于代码符号的有序集合的代码符号子集中的每一个,确定反映代码符号子集中的代码符号的出现频率的相应代码符号概率分布;
对确定的代码符号概率分布进行聚类;以及
基于聚类的代码符号概率分布的聚类中心来确定代码符号概率分布的字典。
6.根据权利要求5所述的系统,其中,对代码符号概率分布进行聚类包括基于散度度量来确定代码符号概率分布之间的距离。
7.根据权利要求1-6中任一项所述的系统,其中,识别代码符号子集的代码符号概率分布包括:
对于字典中的每个代码符号概率分布,基于代码符号概率分布确定代码符号子集的熵编码表示的对应长度;以及
将代码符号子集的代码符号概率分布识别为来自字典的、具有熵编码表示的最小对应长度的代码符号概率分布。
8.根据权利要求7所述的系统,其中,基于代码符号概率分布确定代码符号子集的熵编码表示的长度包括根据代码符号概率分布,确定在代码符号子集中的每个代码符号上的、代码符号的概率的对数的总和。
9.根据权利要求1-8中任一项所述的系统,其中:
由所述压缩子系统执行的操作还包括:
将一个或多个代码符号子集确定为候选代码符号子集;
基于候选代码符号子集确定自定义代码符号概率分布;
基于候选代码符号子集的熵编码表示的长度的减少来确定节省值,所述候选代码符号子集的熵编码表示的长度的减少通过使用自定义代码符号概率分布而不是来自字典的代码符号概率分布对候选代码符号子集进行熵编码来实现;
基于表示自定义代码符号概率分布所要求的数据长度来确定成本值;和
响应于确定节省值大于成本值,则通过使用自定义代码符号概率分布对候选代码符号子集进行熵编码来生成候选代码符号子集的代码符号的熵编码表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980013816.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于图像识别处理的对象分类
- 下一篇:增强现实光场头戴式显示器