[发明专利]一种面向模糊数据库的多维轮廓计算数据处理方法有效
申请号: | 201210380730.X | 申请日: | 2012-10-09 |
公开(公告)号: | CN103714095B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 黄震华;陈千;郭鑫;王栋;向阳;蒋亚琴 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 模糊 数据库 多维 轮廓 计算 数据处理 方法 | ||
技术领域
本发明涉及一种数据处理方法,尤其是涉及一种面向模糊数据库的多维轮廓计算数据处理方法。
背景技术
多维轮廓计算的前身是数学领域的最大矢量计算问题,它旨在所有多维矢量中,虑除那些在各维上都不具有优势的矢量集合。对于过滤之后而剩下的那些矢量,它至少使得一个单调函数取得最优值。在最大矢量计算设计方面,有3个比较经典的算法来解决最大矢量问题,即1975年提出的DD&C算法,1978年提出的LD&C算法以及1990年提出的FLET算法。由于数学领域中的最大矢量计算问题的输入矢量个数相对较少,所以这些算法均是基于内存设计的,而不具有可扩展性。
随着数据库以及相关领域的成熟和壮大,人们从数据库领域的自身特点和应用出发来重新研究最大矢量计算问题,为重新命名为多维轮廓计算。然而这些应用的一个显著特点就是数据量的巨大性,因此在数学领域所使用的方法将不再适用。2001年的ICDE国际会议上,两个不基于任何索引技术且不限于内存的计算算法,即BNL算法和SD&C算法,被提出用于处理多维轮廓计算。由于不使用任何索引机制,因此这两个算法效率比较低。基于这个原因,随后的大部分工作均是从采用某种空间索引技术来研究如何提高多维轮廓计算的速度。比较典型和高效的工作是2002年D.Kossmann等人在VLDB会议上提出的NN算法、2003年D.Papadias等人在SIGMOD会议上提出的BBS算法、2006年M.Sharifzadeh等人在VLDB会议上提出的B2S2算法以及2009年A.Cuzzocrea等人在CIKM提出的LCMA算法。这4个算法均采用空间R树索引来加快产生多维轮廓计算结果集的速度。目前,多数企业针对确定数据库,都使用这四个算法来进行多维轮廓计算。
然而,随着企业对数据采集需求的不断深化和提高,模糊数据得到广泛的重视。在多数实际行业中(例如先进制造、物流、金融、电信、航空航天等行业),企业由于受数据采集设备的精度、数据自身不完整性等因素的制约,使得数据模糊性在企业内部数据源中普遍存在,模糊数据正扮演着关键的角色。由于模糊数据库的结构和模式比确定数据库更为复杂和灵活,因此现有确定数据库上的多维轮廓计算方法无法有效适用于模糊数据库。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种高效、准确的面向模糊数据库的多维轮廓计算数据处理方法。
本发明的目的可以通过以下技术方案来实现:
一种面向模糊数据库的多维轮廓计算数据处理方法,该方法通过等价重构模块、子轮廓优化模块以及模糊数据库模式设计模块实现对多维轮廓计算的数据处理,等价重构模块接收到用户的多维轮廓计算请求后,对该多维轮廓计算进行等价重构,分解为若干个子轮廓计算和若干个轮廓视图分别进行处理,再向用户返回结果;
所述的子轮廓计算通过子轮廓优化模块进行优化,其具体过程为:首先从逻辑层面上确定子轮廓计算的原子操作关系及其最优执行顺序,并根据该顺序逐一执行原子操作,然后在物理层面上与模糊数据库模式设计模块的内的模糊数据库建立索引;
所述的轮廓视图直接由等价重构模块从模糊数据库模式设计模块内的轮廓视图存储库中获取。
所述的等价重构模块进行等价重构的过程具体包括以下步骤:
1)在一阶谓词逻辑重构语义的基础上,设定多维轮廓计算的外延条件,并计算在该外延条件下的时间复杂度开销;
2)根据反转规则和局胚组合优化理论构造等价重构胚源集;
3)由步骤2)得到的胚源集利用演化和代理映射机制生成可造轮廓计算重构片段,最终产生若干个子轮廓计算和轮廓视图。
所述的模糊数据库模式设计模块内的模糊数据库通过三个层次进行底层数据构造,分别为:模糊实体-关系模式、模糊关系代数体系和模糊函数依赖推理系统。
模糊数据库的模糊数据通过无线传感器网络和异构信息抽取系统采集得到。
与现有技术相比,本发明通过等价重构,将多维轮廓计算分解为若干个子轮廓计算和若干个轮廓视图分别进行处理,提高了处理的效率,对于重构后的子轮廓计算,从逻辑层面和物理层面两个层次进行优化,使得多维轮廓计算能够有效的适用于模糊数据库。而且模糊数据库通过三个层次进行底层数据构造,引进了实体概率的定义,使得数据间和属性间的关系、操作和函数依赖蕴含和体现模糊性和不确定特征,从而更准确返回模糊数据库上的多维轮廓计算的结果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210380730.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动变速箱油泵内的功能阀的性能检测装置
- 下一篇:缓冲柱塞、液压缸和工程机械