[发明专利]多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质有效
申请号: | 201910792796.1 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110489428B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 李雄;乔文 | 申请(专利权)人: | 上海燧原智能科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F17/16 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201306 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多维 稀疏 矩阵 压缩 方法 解压缩 装置 设备 介质 | ||
本发明实施例公开了一种多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质。该压缩方法包括:获取待压缩的多维稀疏矩阵,多维稀疏矩阵中包括至少一个低二维矩阵;根据多维稀疏矩阵中各个非零元素所属的低二维矩阵,将各非零元素在低二维矩阵中的行列信息加入索引向量中,将各非零元素的数值信息加入与索引向量匹配的数值向量中,得到多维稀疏矩阵的压缩结果;其中,在索引向量中通过第一分隔信息来分隔不同低二维矩阵的非零元素的行列信息,在数值向量中通过第二分隔信息来分隔不同低二维矩阵的非零元素的数值信息。由此,实现了对多维稀疏矩阵的压缩,且根据多维稀疏矩阵的维度信息及索引向量中分隔信息即可实现对多维稀疏矩阵的解压缩。
技术领域
本发明实施例涉及矩阵压缩技术领域,尤其涉及一种多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质。
背景技术
在科学与工程领域中求解线性模型时,经常会得出许多大型的矩阵,这些矩阵中大部分的元素都为0(即为稀疏矩阵)。存储稀疏矩阵时,可以采用只存储非零元素的压缩存储方式,以达到节约内存的目的,同时还可以提高矩阵的运算速度。
目前,稀疏矩阵的压缩存储格式有多种,如Coordinate Format(COO,坐标格式),Diagonal Storage Format(DIA,对角线存储格式),Compressed Sparse Column Format(CSC,压缩稀疏列格式),Compressed Sparse Row Format(CSR,元素稀疏行格式)等等。
以COO压缩存储格式为例,压缩结果如下:
输入矩阵为:
压缩结果为:row=[0 0 1 1 2 2 2 3 3];indices=[0 1 1 2 0 2 3 1 3];data=[1 7 2 8 5 3 9 6 4]。也即,将矩阵中每个非零元素的所在行的信息、所在列的信息以及元素数值分别对应存储至行向量row、列索引向量indices以及数值向量data中。
上述这些压缩存储格式都有各自适合的应用场景,但是这些压缩存储格式主要应用于压缩存储二维矩阵,若直接应用于压缩存储多维矩阵,则会存在诸多问题。
以采用COO压缩存储方式压缩存储多维矩阵为例,存在如下问题:
1)row和indices压缩结果中只有该非零元素在当前低二维矩阵中的行列信息,没有高维度的信息,进而无法区分高维度中的非零元素;
其中,低二维矩阵指的是多维矩阵中一个二维矩阵单元,以一个4×3×4的三维矩阵为例,这个三维矩阵包括4个二维矩阵单元,每个二维矩阵单元的维度为3×4。输入矩阵为:
则,非零元素5所在的低二维矩阵即为
注:上述矩阵中每个“x(Exxx)”均表示元素的数值及其索引坐标,例如“1(E323)”中的“1”表示元素的数值,“E323”表示元素的索引坐标。
2)如果某低二维矩阵为全零元素(比如前述举例三维矩阵中的第三个二维矩阵单元),则该低二维矩阵的信息在压缩结果中无法体现,进而导致无法区分后面的非零数据是哪个维度的数据。而且,无法根据压缩结果进行解压缩。
3)如果压缩结果增加额外的高维度向量,则会使压缩结果数据量增大,失去了压缩的目的。
发明内容
本发明实施例提供一种多维稀疏矩阵压缩方法、解压缩方法、装置、设备及介质,以实现对多维稀疏矩阵的压缩及解压缩。
第一方面,本发明实施例提供了一种多维稀疏矩阵的压缩方法,包括:
获取待压缩的多维稀疏矩阵,所述多维稀疏矩阵中包括至少一个低二维矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海燧原智能科技有限公司,未经上海燧原智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910792796.1/2.html,转载请声明来源钻瓜专利网。