[发明专利]基于属性级不确定性模型的一对多型PSJ聚集查询方法在审
申请号: | 201711208820.X | 申请日: | 2017-11-27 |
公开(公告)号: | CN108073689A | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 陈岭;王俊凯 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不确定性 一对多 查询 概率分布 子集 联机分析处理 动态规划 数据仓库 依赖关系 建模 全集 数据库 应用 | ||
1.一种基于属性级不确定性模型的一对多型PSJ聚集查询方法,包括以下步骤:
(1)利用属性级不确定性模型为一对多型PSJ建模,形成PSJ全集的建模结果,PSJ为概率型相似性连接,具体包括:
(1-1)为PSJ多端的每一条元组构造一条虚拟连接,确保互斥连接的概率和为1;
(1-2)为满足COUNT查询谓词条件的PSJ增加标志属性,为满足SUM查询谓词条件的PSJ增加求和属性;
(1-3)采用属性级不确定性模型对PSJ建模,将多端的每一条元组建模为一条属性级不确定性元组,组成属性级不确定性元组全集,形成PSJ全集的建模结果;
(2)基于所述建模结果,采用动态规划思想,计算PSJ子集的聚集值概率分布,并基于所述PSJ子集的聚集值概率分布的结果,计算PSJ全集的聚集值概率分布;
计算PSJ子集的聚集值概率分布包括:
首先,选取PSJ子集T1,所述PSJ子集T1只包含一条属性级不确定性元组t1,所述PSJ子集T1的不确定性属性值为{F1_1,F1_2,…,F1_k},对应的概率为{p1_1,p1_2,…,p1_k};
然后,枚举出所述PSJ子集T1的可能世界空间W1,W1包含k个可能世界实例{w1,…,wk};
最后,计算每个可能世界实例的聚集值y及其概率pr(y,T1),得到所述PSJ子集的聚集值概率分布PrD(Y,T1),将其存储在链表List中;
计算PSJ全集的聚集值概率分布包括:
(a)假设已知PSJ子集Ti-1,所述PSJ子集Ti-1包含第i-1条元组,所述PSJ子集Ti-1的可能世界空间为Wi-1,聚集值概率分布为PrD(Y,Ti-1),存储在链表List中;
(b)向所述PSJ子集Ti-1中插入一条不确定性元组ti,构成PSJ子集Ti;
(c)将所述PSJ子集Ti的可能世界空间表示为Wi,假设不确定性元组ti有k个属性值,将所述可能世界空间Wi分为k部分,分别表示为Wij(1≤j≤k);
(d)所述可能世界空间Wij与所述可能世界空间Wi-1相比,可能世界实例中多一条不确定性元组ti,ti的属性值取值为Fi_j,在PrD(Y,Ti-1)的基础上,计算Wij的聚集值概率分布PrDj(Y,Ti);
(e)所述PSJ子集Ti的可能世界空间Wi由{Wi1,…,Wik}组成,其聚集值为y的概率等于{Wi1,…,Wik}中聚集值为y的概率和,合并临时链表List1,…,Listk,得到所述PSJ子集Ti的聚集值概率分布PrD(Y,Ti);
(f)重复步骤(b)~(e),直到返回所述PSJ全集的聚集值概率分布为止;
所述步骤(d)包括:
所述可能世界空间Wij的聚集值值域等于Wi-1的聚集值值域再加上Fi_j;
且所述可能世界空间Wij中聚集值为y的概率等于Wi-1中聚集值为y-Fi_j的概率再乘以pi_j,并将所述可能世界空间Wij的聚集值概率分布PrDj(Y,Ti)存储在临时链表中Listj中;
依此类推,得到Wi1,…,Wik的聚集值概率分布,依次表示为PrD1(Y,Ti),…,PrDk(Y,Ti),并分别将其存储在临时链表中List1,…,Listk中;
所述步骤(e)包括:
首先,清空链表List中原有的数据;
然后,针对k个临时链表中聚集值相同的项,将其概率相加,然后插入到链表List中,针对聚集值不相同的项,直接将其插入到链表List中;
最后,删除所有临时链表。
2.如权利要求1所述的基于属性级不确定性模型的一对多型PSJ聚集查询方法,其特征在于,所述步骤(1-2)包括:
若聚集查询为COUNT查询,则为PSJ增加一个属性F,表示所述PSJ是否满足谓词条件,若所述PSJ满足谓词条件,那么F=1,否则F=0;
若聚集查询为SUM查询,则为PSJ增加一个属性F,表示所述PSJ求和属性值的大小,若所述PSJ连接满足谓词条件,那么F等于所述PSJ的原始求和属性值,否则F=0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711208820.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据迁移的方法及装置
- 下一篇:一种视频目标检索方法