[发明专利]基于双向位图的稀疏矩阵压缩存储方法有效
申请号: | 201910003397.2 | 申请日: | 2019-01-03 |
公开(公告)号: | CN109740023B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 甘新标;曾瑞庚;吴涛;杨志辉;孙泽文;刘杰;龚春叶;李胜国;杨博;徐涵 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 长沙中科启明知识产权代理事务所(普通合伙) 43226 | 代理人: | 任合明 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 位图 稀疏 矩阵 压缩 存储 方法 | ||
本发明公开了一种双向位图的稀疏矩阵压缩存储方法,目的是减少存储空间。技术方案为:仅保留存储一个或者多个顶点或边的起始位置来压缩图的邻接矩阵按行压缩存储数据结构,在行列两个方向使用位图数组来辅助识别顶点的边信息。具体方法包括:读取图的邻接矩阵按行压缩存储数据结构;构建改进型位数组;计算偏移量;构建行方向位图数组,由改进型位数组和行方向位图数组压缩存储行数组;计算列数组连续片段长度并构建连续片段二元组集合;构建简化列数组和列方向位图数组,由简化列数组和列方向位图数组压缩存储列数组。可以将图数据存储空间在行方向位图数组的基础上进一步压缩,极大规模扩大图的应用规模,优化采用图结构的应用程序的性能。
技术领域
本发明涉及大数据存储方法,尤指基于双向位图的稀疏矩阵压缩存储方法。
背景技术
图结构是大数据应用中最重要的数据结构之一,在众多领域中得到广泛的应用,如社交媒体、生物信息学、天体物理学、人工智能、数据挖掘、智能推荐、自然灾害预测等等。这些应用的共同特点是数据量大和结构复杂,往往可以达到数十亿条边和数万亿个节点,这导致在数据存储和计算力方面有更高的需求。超级计算机主要用于数值计算,大多数高性能计算机的基准测试都是以计算力作为衡量标准,如Top 500采用的HPL(HighPerformance Linpack)。在数据密集型应用广泛兴起的大数据时代,Graph 500成为了一个新的超级计算机计算力的基准测试程序。Graph 500作为Top500的重要补充,以每秒遍历图中的边的数量(TEPS)来衡量超级计算机的大数据处理能力。
Graph500中图遍历采用宽度优先搜索即BFS(breadth-first search)算法。宽度优先搜索算法可描述为:已知图G=(V,E)和一个源顶点s,宽度优先搜索将探寻G的所有边,从而发现s所能到达的所有顶点,并计算s到所有这些顶点的距离(最少边数),该算法同时能生成一棵根为s且包括所有可达顶点的宽度优先树,对从s可达的任意顶点v,宽度优先树中从s到v的路径对应于图G中从s到v的最短路径。
图G=(V,E)包含顶点集合V和边集合E,通常使用vi表示V中编号为i的顶点,使用顶点对(vi,vj)表示顶点i到顶点j的边,(vi,vj)∈E,0≤i≤NV-1,0≤j≤NV-1,NV为V中顶点个数。G通常用邻接矩阵A表示,A中的第i行Ai为邻接表。如图1所示,形如图1(a)的图G可用图1(b)的邻接矩阵A表示,A中第i行第j列的元素Aij表示边(vi,vj)。通常使用1表示存在这样的边,0表示不存在这样的边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910003397.2/2.html,转载请声明来源钻瓜专利网。