[发明专利]识别要压缩的数据块中的表边界检测的方法与系统有效
申请号: | 201310130388.2 | 申请日: | 2013-04-16 |
公开(公告)号: | CN103377278A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | J·阿秘特;L·德米多;N·哈罗瓦尼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 鲍进 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 压缩 数据 中的 边界 检测 方法 系统 | ||
技术领域
本发明总体上涉及计算机,尤其涉及在计算环境中要压缩的数据块中的表边界检测。
背景技术
在当今社会,计算机系统是很平常的。计算机系统可以在工作场所、在家里或者在学校找到。计算机系统可以包括数据存储系统、或者磁盘存储系统,以处理和存储数据。数据存储系统,或者磁盘存储系统,用于处理和存储数据。存储系统可以包括一个或多个磁盘驱动器。这些数据处理系统一般需要大量的数据存储。消费者数据,或者由用户在数据处理系统中产生的数据,占用了这种数据存储的大部分。这些计算机系统中的许多都包括虚拟存储部件。
数据压缩广泛地用于减少处理、发送或存储给定量的信息所需的数据量。数据压缩是对数据的编码,以最小化其表示。压缩可以用于例如减少文件的存储需求,以便增加信道上的通信率,或者在加密之前减少冗余以获得更大安全性。
发明内容
计算系统用于存储和管理各种类型的数据,诸如所谓的“表格数据(tabular data)”。表格数据一般组织成行与列,以形成常见的表,例如,就像在关系表、文字处理文档、电子数据表或者像电子数据表的结构或者类似的数据库结构中所使用的那样。这些表的形成包括用于行与列的多种有组织的阵列与布置。但是,表格数据的实际物理存储可以采取多种形式。例如,尽管表格数据的逻辑结构可以是多维的,但是表格数据也可以按线性格式物理地存储,诸如以行为主或者以列为主的格式。在以行为主的格式中,来自类似表(table-like)的结构的一行的列值在永久性存储装置中连续地存储。在大多数数据文件中,重要的信息一般是以表的形式存储和布置的。表中的数据可以被存储和提取。但是,表中数据形成(formation)的识别对于通过利用其它各种管理系统的数据查询数据和将数据与利用其它各种管理系统的数据的结合是必需的。目前,由于各种挑战,难以改进要压缩的数据块中表边界的检测。
相应地,并且鉴于前面所述,提供了在计算环境中由处理器设备检测要压缩的数据块中的表边界的各种示例性方法、系统与计算机程序产品实施例。仅仅是作为例子,在一种实施例中,通过根据用于建立表边界形成模式的符号表示给数据流分类,利用后缀树把数据转换成最小化的数据表示。在维持最小的头信息的同时,转换后的数据对于重构是完全可逆的。
除了以上的示例性方法实施例,还提供了其它的示例性系统与计算机产品实施例并且提供相关的优点。以上概述的提供是为了以简化的形式介绍在以下具体描述中进一步描述的概念的选择。本概述不是要识别所保护主题的关键特征或必需特征,也不是要用于帮助确定所保护主题的范围。所保护的主题不限于解决背景中所提到的任何或全部缺点的实现。
附图说明
为了很容易地理解本发明的优点,以上简要描述过的本发明的更特定描述将通过参考在附图中说明的具体实施例来给出。应当理解,这些附图绘出了本发明的实施例而且因此不应当认为是限定其范围,将通过附图的使用来描述并解释本发明附加的特殊性和细节,附图中:
图1是说明其中可以实现本发明各方面的、具有示例性存储设备的计算机存储环境的框图;
图2是说明其中可以实现本发明各方面的计算机系统中的示例性数据存储系统的硬件结构的框图;
图3是说明其中可以实现本发明各方面的、用于识别“最佳”建议数据表格式的示例性方法的流程图;
图4是说明其中同样可以实现本发明各方面的、用于识别最佳建议数据表格式的另一种示例性方法的流程图;
图5A-5B是说明其中可以同样实现本发明各方面的、用于识别最佳建议数据表格式的另外一种示例性方法的流程图;及
图6是说明具有头信息的示例性输出数据文件的框图。
具体实施例
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310130388.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置