[发明专利]处理相关数据集有效
申请号: | 201180040706.5 | 申请日: | 2011-06-22 |
公开(公告)号: | CN103080932A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | A.F.罗伯茨 | 申请(专利权)人: | 起元技术有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 于小宁 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 相关 数据 | ||
对于相关申请的交叉引用
本发明要求通过引用包含的、在2010年6月22日提交的美国申请第61/357,376号的优先权。
技术领域
本发明涉及处理相关数据集。
背景技术
数据集是例如在任何数量的物理存储介质上容纳的数据存储系统中存储(例如,在一个或多个服务器上容纳的数据库中存储)的数据的集合。可以例如通过诸如文件或其他形式的对象(例如,在面向对象的数据库中存储的对象)的实体来描述数据集的诸如其结构和存储位置的属性。在一些情况下,用于描述特定数据集的实体(例如,文件)也存储在那个数据集中的数据。在一些情况下,用于描述特定数据集的实体(例如,指向数据库表格的对象)不必然存储在那个数据集中的所有数据,而是可以用于定位在数据存储系统中的一个或多个位置中存储的数据。
可以使用多种结构的任何一种来组织在数据集中的数据,该多种结构包括向单独的记录提供用于相应字段的值(也称为“属性”或“列”)的记录结构,该值可能包括空值(例如,指示字段是空的)。例如,该记录可以对应于在数据库系统的数据库表格中的行或在电子表格或其他平面文件中的行。为了访问以给定格式存储的记录,数据处理系统通常以某种初始格式信息馈送,该某种初始格式信息描述特性,诸如字段的名称、在记录中的字段的顺序、表示字段值的比特的数量、字段之后的类型(例如,字符串、带符号/不带符号的整数)。在一些情况下,可能初始不知道或可以在数据的分析后确定数据集的记录格式或其他结构信息。
数据集可以以多种方式的任何一种彼此相关。例如,与在数据库中的第一表格对应的第一数据集可以包括与在数据库中的第二表格的字段具有主密钥(key)/外密钥关系的字段。在第一表格中的主密钥字段可以包括唯一地识别在第一表格中的行的值(例如,用于唯一地识别与不同的客户对应的行的客户ID值),并且包含与在第一表格中的主密钥字段对应的外密钥字段的在第二表格中的行(例如,与由给定客户进行的交易对应的行)可以使用那些唯一值之一来识别表示由给定客户进行的交易的在第二表格中的一个或多个行的每一个。在多个数据集之间保留引用完整性可以包括保留在不同的字段之间的关系,包括外密钥/主密钥关系或在一个数据集中的字段中的值取决于另一个数据集的字段中的值的其他关系。
发明内容
在一个方面,通常,一种用于处理相关数据集的方法包括:通过输入装置或端口接收来自多个数据集的给定数据集的记录,所述给定数据集的记录具有用于一个或多个相应字段的一个或多个值;并且,在数据处理系统中处理来自所述多个数据集的每一个的记录。所述处理包括:分析在数据存储系统中存储的至少一个约束规范,以确定对于所述多个数据集的处理顺序,所述约束规范指定用于保留在包括所述多个数据集的一组相关数据集之间的引用完整性或统计一致性的一个或多个约束;以所述确定的处理顺序向来自所述多个数据集的每一个的记录应用一个或多个变换,其中,在向来自所述多个数据集的第二数据集的记录应用所述变换之前,向来自所述多个数据集的第一数据集的记录应用所述变换,并且至少部分地基于向来自所述第一数据集的所述记录应用所述变换的结果和由所述约束规范指定的在所述第一数据集和所述第二数据集之间的至少一个约束来应用向来自所述第二数据集的所述记录应用的所述变换;以及,存储或输出对于来自所述多个数据集的每一个的所述记录的所述变换的结果。
方面可以包括下面的特征的一个或多个。
用于保留由所述约束规范指定的引用完整性的至少一个约束基于用于所述第二数据集的字段的值对于用于所述第一数据集的字段的值的依赖。
所述第一数据集的所述字段是主密钥,并且所述第二数据集的所述字段是引用所述主密钥的外密钥。
所述约束规范包括在所述第二数据集的所述字段和所述第一数据集的所述字段之间的外密钥与主密钥关系的表示。
确定用于所述多个数据集的所述处理顺序包括:确定所述第一数据集以基于用于所述第二数据集的字段的值对于用于所述第一数据集的字段的值的依赖的处理顺序来在所述第二数据集之前出现。
在所述变换被应用到来自所述第二数据集的记录之前,并且在所述变换被应用到来自所述第一数据集的记录之后,向来自第三数据集的记录应用所述变换。
用于保留由所述约束规范指定的统计一致性的至少一个约束基于在所述第二数据集的字段和所述第一数据集的字段之间的等同。
所述第一数据集的所述字段和所述第二数据集的所述字段是在结合操作中的密钥。
所述约束规范包括所述结合操作的表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元技术有限责任公司,未经起元技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180040706.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:集成式淋浴房套件
- 下一篇:一种座架式客厅电视矮柜
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置