[发明专利]搜索处理方法和设备无效
申请号: | 200610142796.X | 申请日: | 2006-10-31 |
公开(公告)号: | CN101086736A | 公开(公告)日: | 2007-12-12 |
发明(设计)人: | 柱野正树;松本修 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟;迟军 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 处理 方法 设备 | ||
技术领域
本发明涉及用于数据库的搜索处理技术。
背景技术
例如,USP6,643,644公开了如下技术。以下,特别地,对其中存在如图1所示的关系数据库(RDB)的数据的情况进行说明。图1示出了销售历史表的一部分,该销售历史表包括19条记录,这些记录具有各项目(属性)(这些项目是客户ID、日期和时间、产品、价格以及商店代号)的相应项目值。顺便指出,为描述方便起见,“rowid”表示行号(也被成为记录号)。
在上述美国专利中将如图1所示的数据保持为如图2所示的数据。即,该数据包括:ROOT数组9001;与客户ID的项目有关的POS数组9002和值表9003;与日期和时间的项目有关的POS数组9004和值表9005;以及与产品名称的项目有关的POS数组9006和值表9007。ROOT数组9001是保持待在各POS数组中参考的行号的数组。对于顾客ID,值表9003唯一地标识了顾客ID的项目值(001到007),并且POS数组9002在每个行(即,位置)中保持指向值表9003的待针对如下纪录来参考的行的指针,所述记录的记录号被存储在ROOT数组9001中的相对应的行中。例如,当要处理POS数组9002的第一行时,这是记录1的数据,在POS数组9002中保持的“1”通过参考值表9003的第一行来表示客户ID“001”。类似地,对于日期和时间,值表9005唯一地标识了日期和时间的项目值(3月1日10:00到3月9日19:00),并且POS数组9004在每个行(即,位置)中保持指向值表9005的待针对如下纪录来参考的行的指针,所述记录的记录号被存储在ROOT数组9001中的相对应的行中。同样,对于产品名称,值表9007唯一地标识了产品名称的项目值(DVD软件到电冰箱),并且POS数组9006在每个行(即,位置)中保持指向值表9007的待针对如下纪录来参考的行的指针,所述记录的记录号被存储在ROOT数组9001中的相对应的行中。
即,采用了这样的数据结构,在该数据结构中,对于各项目保持有:保持有唯一地标识项目值的项目值编号与项目值之间的关系的值表,和按记录的次序存储有指定了项目值编号的信息的项目值编号指定信息数组。
通过保持这种数据结构,例如,在提取其客户ID为“001”的记录的情况下,在值表9003中识别出其中保持有“001”的行的行号“1”,并且POS数组9002中的保持有所识别出的行号“1”的多个行的行号“1”、“2”、“10”以及“14”是待提取的记录号。
这里,在图1所示的销售历史表中,考虑提取如下客户的搜索:该客户购买了“HDD记录器”、“DVD播放器”或“TV(电视机)”,然后购买了任何“软件”,再购买了“DVD-R”或“CD-RW”。
尽管上述专利未直接公开这种搜索方法,但是通常必须执行以下过程。首先,针对各客户ID并按日期和时间次序对数据进行排序。对于如图1所示的RDB,在存在巨大数据量的情况下排序本身就是困难的。然而,当使用如图2所示的数据结构时,可以对数据进行排序,因为降低了数据量。为了使得容易理解,将按图1的格式的排序结果示于图3,而将只包括记录号的排序结果示于图4。将图4的排序结果保持为SET数组9011,按记录1、记录2、记录10以及记录14...的次序排列这些记录。也将该记录号称为SETID。
然后,作为第一个步骤,提取与“HDD记录器”、“DVD播放器”或“TV”相对应的记录。在这种情况下,如图5所示,按SET数组9011的序次,参考产品名称的POS数组9006以读出相对应的项目值编号,并在表9007中识别出位于该项目值编号的位置处的项目值,以判断是否满足上述第一条件。SET数组9011中的第1个记录号是“1”,因此识别出“5”,它是POS数组9006中的第1个项目值编号。然后,读出“TV”,它是表9007中的第5个项目值。因此,满足上述第一条件,并提取出记录号“1”。例如,SET9011中的第3个记录号是“10”,因此识别出“1”,它是POS数组9006中的第10个项目值编号。然后,读出“DVD软件”,它是表9007中的第1个项目值。因此,不满足上述第一条件,因而不提取记录号“10”。重复这种处理。
然后,得到了类似于图6所示的数组9021的SETID序列。由于仅通过该数组不容易理解具体内容,因此将所提取的记录的具体内容示于表9022中。然而,由于仅通过该数据并不知道是否满足第二条件,因此必须再次参考SET数组9011的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610142796.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网元设备仿真图像的生成方法及生成装置
- 下一篇:供电子装置使用的转动装置