[发明专利]字尾数组候选选择和索引数据结构有效
申请号: | 201180064535.X | 申请日: | 2011-11-09 |
公开(公告)号: | CN103282902B | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | P·奥斯特曼 | 申请(专利权)人: | 泰必高软件公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京嘉和天工知识产权代理事务所(普通合伙) 11269 | 代理人: | 严慎 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于识别数据集的候选子集的方法和系统包括将查询字段值的字尾与数据集中的记录的数据字段值进行比较。足够相似的记录被包括在候选子集中。查询字段值字尾的长度范围可以为从其查询字段值本身下至最小字尾长度。可以首先处理最长字尾,然后可以处理依次较短的字尾,直到满意数量的候选被识别为止。从数据集推导的索引数据结构中的项可以使在数据集中找到的各个字尾与单个记录相关联。数据结构项可以包括识别具有与字尾相同的数据字段值的记录的记录关键字,并且还可以包括识别具有与该项的字尾相似的字尾的相关数据结构项的字尾指针。 | ||
搜索关键词: | 尾数 候选 选择 索引 数据结构 | ||
【主权项】:
一种用于识别数据集的候选子集的方法,所述数据集包括用数据字段结构化的多个记录,每个记录的数据字段包括数据字段值,所述数据字段值包括一个或更多个单字的序列,所述方法包括:辨识查询字段值,所述查询字段值包括以U1开头并且以UN结束的N个单字的序列,其中U用符号表示单字,N用符号表示非负整数值;以及执行候选产生迭代循环的第一步、第二步、第三步和第四步,其中所述第一步包括识别查询字段值字尾,所述查询字段值字尾包括以U1+J开头并且以UN结束的N‑J个单字的序列,其中J用符号表示小于N的非负整数值,所述第二步包括识别所述数据集的限定子集,其中当所述限定子集中的每个记录的数据字段值与所述查询字段值字尾比较时,所述记录满足相似性标准,所述第三步包括将识别的限定子集记录包括在所述候选子集中,并且所述第四步包括当所述候选子集中的记录的数量少于满意数量的候选时,并且当N‑J大于最小字尾长度时,则增大J并执行所述候选产生迭代循环的第一步、第二步、第三步和第四步;其中识别所述数据集的限定子集的步骤包括访问从所述数据集推导的索引数据结构,所述索引数据结构包括关于每个记录的数据字段值的每个数据字段值字尾的索引数据结构项,每个数据字段值字尾包括单字序列,并且使所述单字序列与所述数据集记录中的一个或更多个相关联;其中关于每个记录的数据字段值的每个数据字段值字尾的所述索引数据结构项进一步限定以下第一个索引数据结构项、第二个索引数据结构项、第三个索引数据结构项、第四个索引数据结构项以及第五个索引数据结构项:所述第一个索引数据结构项包括第一项索引单字序列、零个第一项记录关键字、第一个第一项字尾指针以及第二个第一项字尾指针,所述第一个第一项字尾指针识别所述第二个索引数据结构项,并且所述第二个第一项字尾指针识别所述第三个索引数据结构项;所述第二个索引数据结构项包括第二项索引单字序列、第一个第二项记录关键字、第二个第二项记录关键字以及第二项字尾指针,所述第二项索引单字序列的最后单字与所述第一项索引单字序列相同,所述第一个第二项记录关键字识别所述数据集中的第一个记录,所述第一个记录的数据字段值与所述第二项索引单字序列相同,所述第二个第二项记录关键字识别所述数据集中的第四个记录,所述第四个记录的数据字段值与所述第二项索引单字序列相同,并且所述第二项字尾指针识别所述第四个索引数据结构项;所述第三个索引数据结构项包括第三项索引单字序列、第三项记录关键字以及零个第三项字尾指针,所述第三项索引单字序列的最后单字与所述第一项索引单字序列相同,并且所述第三项记录关键字识别所述数据集中的第二个记录,所述第二个记录的数据字段值与所述第三项索引单字序列相同;所述第四个索引数据结构项包括第四项索引单字序列、零个第四项记录关键字以及第四项字尾指针,所述第四项索引单字序列的最后单字与所述第二项索引单字序列相同,并且所述第四项字尾指针识别所述第五个索引数据结构项;以及所述第五个索引数据结构项包括第五项索引单字序列、第五项记录关键字以及零个第五项字尾指针,所述第五项单字序列的最后单字与所述第四项索引单字序列相同,并且所述第五项记录关键字识别所述数据集中的第三个记录,所述第三个记录的数字字段值与所述第五项索引单字序列相同。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰必高软件公司,未经泰必高软件公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180064535.X/,转载请声明来源钻瓜专利网。