[发明专利]生成数据模式信息有效
申请号: | 201280006850.1 | 申请日: | 2012-01-27 |
公开(公告)号: | CN103348598B | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 阿伦·安德森 | 申请(专利权)人: | 起元科技有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G06F17/30 |
代理公司: | 隆天知识产权代理有限公司72003 | 代理人: | 郝新慧,张浴月 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 数据 模式 信息 | ||
相关申请的交叉引用
本申请要求享有2011年1月28日提交的美国临时申请号61/437,361的优先权。
技术领域
本申请涉及生成数据模式(pattern)信息。
背景技术
在数据库系统中,数据可以以各种格式中的任一种存储在单独访问(individually accessible)单元或“记录”中。每个记录可对应于诸如信用卡交易的逻辑实体,并且典型地具有用于唯一标识该记录的相关联的主键(primary key)。该记录可包括与记录格式的各个字段(field)相关联的多个值。这些记录可以存储在一个或多个文件(例如,平面文件(flat file)或诸如XML文件的结构化数据文件)中。在压缩的数据库系统中,记录中的单独记录或值可以在存储时被压缩,并在访问时被解压缩,以降低系统的存储需求。
发明内容
在一个方案中,通常,一种方法包括:在数据存储系统中,存储包括多个记录的至少一个数据集;以及在连接到所述数据存储系统的数据处理系统中,处理所述多个记录以产生表示多个记录中的数据模式的代码,所述处理包括:对于所述多个记录中的多个记录的每一个,将对一个或多个元素进行编码的代码与所述记录相关联,其中每个元素将对应字段或字段组合的状态或属性表示为一组元素值中的一个,以及,对于至少第一代码的至少一个元素,所述组中的元素值的数量小于在所述数据集中的所有所述多个记录上出现在所述对应字段或字段组合中的数据值的总数。
这些方案可包括一个或多个以下特征。
对于所述第一代码的至少一个元素,所述组中的至少两个元素值将字段的状态分别表示为填充或未填充。
所述未填充的状态包括null状态、缺省(absent)状态或空(empty)状态中的一个。
所述null状态包括具有预定值的所述字段的状态。
所述预定值包括一个或多个空格字符。
所述缺省状态包括在记录中缺失的所述字段。
所述空状态包括没有对应数据值的所述字段。
对于所述第一代码的至少一个元素,根据与字段相关联的验证规则,所述组中的至少两个元素值表示出现在所述字段中在有效或无效的数据值。
所述验证规则至少部分基于所述数据值的数据类型来定义有效值。
所述验证规则至少部分通过参考枚举值的列表来定义有效值。
对于所述第一代码的至少一个元素,所述组中的一个或多个元素值表示出现在第一字段中的数据值与目标数据值相匹配的程度。
所述目标数据值为出现在第二字段中的数据值。
所述组中的至少三个元素值将出现在所述第一字段中的所述数据值与所述目标数据值相匹配的程度分别表示为不匹配、精确匹配或模糊匹配。
对于所述第一代码的至少一个元素,所述组中的至少一个元素值对这样一个数据值进行编码,所述数据值从出现在第一记录的字段或字段组合中的一个或多个值和出现在至少包括不同于所述第一记录的第二记录的一组一个或多个记录的字段或字段组合中的一个或多个值中计算得出。
所述第一记录位于第一数据集中以及所述第二记录位于不同于所述第一数据集的第二数据集中。
对于至少第二代码的至少一个元素,所述组中的至少一个元素值表示出现在字段中的预定数据值。
对于所述第二代码的所述元素的该组元素值中的元素值的数量等于在所述数据集中的所有所述多个记录上出现在所述对应字段或字段组合中的数据值的总数。
在另一个方案中,通常,计算机可读存储介质存储计算机程序,所述计算机程序包括用于使计算机系统执行以下步骤的指令:在数据存储系统中,存储包括多个记录的至少一个数据集;以及在连接到所述数据存储系统的所述计算机系统的至少一个处理器中,处理所述多个记录以产生表示所述记录中的数据模式的代码,所述处理包括:对于所述多个记录中的多个记录的每一个,将对一个或多个元素进行编码的代码与所述记录相关联,其中每个元素将对应字段或字段组合的状态或属性表示为一组元素值中的一个,以及,对于至少第一代码的至少一个元素,所述组中的元素值的数量小于在所述数据集中的所有所述多个记录上出现在所述对应字段或字段组合中的数据值的总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元科技有限公司,未经起元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280006850.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置