[发明专利]一种高维环境中模糊数据的概率窗口查询方法无效
申请号: | 201110437136.5 | 申请日: | 2011-12-23 |
公开(公告)号: | CN102609439A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 胡天磊;寿黎但;陈刚;陈珂;马春洋 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H03M7/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林怀禹 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 模糊 数据 概率 窗口 查询 方法 | ||
技术领域
本发明涉及数据库系统、信息检索、高维模糊数据的压缩和查询技术,特别是涉及一种高维环境中模糊数据的概率窗口查询方法。
背景技术
在越来越多的应用中,数据都展现了模糊性。并且,很多模糊数据都处于一个高维环境当中。这样的应用数据包括传感器数据库中多维数据、城市人口普查数据、以及图像处理数据等。这一类型的应用中,每个物体由一个模糊区域和一个概率分布函数来表示。概率分布函数可以为连续的概率分布函数,也可以是离散的概率分布函数。
在实际应用当中,窗口查询是最为基础且最为重要的查询类型。此外,窗口查询还经常被用作各种复杂的多维查询在查询处理时的过滤机制。一个概率窗口查询指定一个查询窗口和一个概率阈值,它从数据库中查找处于该查询窗口的概率大于给定阈值的所有物体。
现有的可以处理概率窗口查询的方法多针对低维环境中的数据所设计,无法在数据维度较高时仍保持良好的查询性能。而传统的能够在高维情况下仍保持良好查询性能的方法都无法在模糊数据集上使用。
在这种情况下,设计一种可以有效管理各种海量高维数据的索引结构和概率窗口查询处理方法是十分重要。
发明内容
本发明的目的在于提供一种高维环境中模糊数据的概率窗口查询方法。
本发明解决其技术问题采用的技术方案的步骤如下:
1)将物体的模糊区域信息用网格划分方法进行压缩;
2)将物体的概率分布函数信息用柱状图方法进行压缩;
3)将步骤2)中的柱状图的信息用小波变换方法进行压缩;
4)将步骤1)和步骤3)中每一个物体的全部压缩信息保存在索引文件中;
5)在查询处理时,利用每一个物体的全部压缩信息计算每一个物体成为查询结果的概率的上界;
6)利用每一个物体的概率上界对不合格的物体进行剪枝,从而得到一个候选答案集合;
7)根据候选答案集合中每一个候选物体的未被压缩的模糊区域信息和概率分布函数信息,判断每一个候选物体是否是真正的查询结果。
所述的步骤1)利用网格划分方法对物体的模糊区域信息进行压缩,从而使用比特值来表示物体的模糊区域。
所述的步骤2)利用柱状图方法对物体的概率分布函数信息进行压缩,得到一个概率的序列。
所述的步骤3)中对步骤2)中得到的概率的序列进行小波变换,然后从得到的所有小波系数中删除绝对值大于零的小波系数。
所述的步骤4)中将每一个物体的全部压缩信息保存在索引文件中,使得物体在索引文件中的存储顺序和物体在数据库中的存储顺序相同。
所述的步骤5)中利用每一个物体的全部压缩信息,计算每一个物体出现在概率窗口查询的查询窗口中的概率的最紧上界。
所述的步骤6)中如果一个物体的概率的最紧上界小于概率窗口查询指定的概率阈值,则该物体是不合格物体,将在这一步骤中被剪枝掉。
所述的步骤7)中根据候选答案集合中每一个候选物体的未被压缩的模糊区域信息和概率分布函数信息,计算每一个候选物体出现在概率窗口查询的查询窗口中的精确概率;如果一个候选物体的精确概率大于概率窗口查询指定的概率阈值,则这个候选物体成为最终的查询结果。
本发明具有的有益效果是:
本发明充分利用了数据库和信息检索的现有研究和实现成果,基于已有的压缩方法的扩展和融合可以非常方便快捷的提供模糊数据的概率窗口查询能力,并且不依赖于模糊数据的维度,为使用者提供最好的性能。本发明可以用于多维传感器数据、城市人口普查数据、以及图像数据等各种海量数据的管理与查询。
附图说明
图1是概率窗口查询方法示意图。
图2是用网格划分方法压缩物体模糊区域信息的示意图。
图3是用柱状图方法压缩物体概率分布函数信息的示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明具体实施过程和工作原理,如图1所示:
1)将物体的模糊区域信息用网格划分方法进行压缩;
2)将物体的概率分布函数信息用柱状图方法进行压缩;
3)将步骤2)中的柱状图的信息用小波变换方法进行压缩;
4)将步骤1)和步骤3)中每一个物体的全部压缩信息保存在索引文件中;
5)在查询处理时,利用每一个物体的全部压缩信息计算每一个物体成为查询结果的概率的上界;
6)利用每一个物体的概率上界对不合格的物体进行剪枝,从而得到一个候选答案集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110437136.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电热水瓶
- 下一篇:一种N-苯基-3-(4-溴苯基)咔唑的合成方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置