[发明专利]一种不确定数据流概率求和阈值查询方法有效
申请号: | 201911106844.3 | 申请日: | 2019-11-13 |
公开(公告)号: | CN111026784B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 陈岭;陈东辉 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/248 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 不确定 数据流 概率 求和 阈值 查询 方法 | ||
1.一种不确定数据流概率求和阈值查询方法,其特征在于,所述方法包括以下步骤:
(1)将连续不确定数据进行滑动窗口的划分以及对每个窗口内的随机变量进行高斯混合模型建模,即利用高斯分布表示随机变量;
(2)基于滑动窗口内随机变量之和的第一阶矩和第一阶方差、第二阶矩和第二阶方差对随机变量进行两次过滤判断,在依据第一阶矩和第一阶方差进行第一次过滤判断能够得到获得查询结果时,输出查询结果并返回到步骤(1),在依据第一阶矩和第一阶方差进行第一次过滤判断不能够得到获得查询结果时,依据第二阶矩和第二阶方差进行第二次过滤判断,在能够得到获得查询结果时,输出查询结果并返回到步骤(1),不能够得到获得查询结果时,进入步骤(3);
(3)将滑动窗口内的随机变量转换为特征函数,基于特征函数进行概率求和,依据求和的概率值与得分阈值和概率阈值的大小关系,判断查询结果为“是”或“否”,并输出查询结果;
步骤(3)具体过程为:
(3-1)将每条随机变量Xm用特征函数表示;
随机变量Xm建模为高斯混合模型,该高斯混合模型由k个期望为(μ1,μ2,…,μk)、方差为以及对应的概率为(p1,p2,…,pk)的高斯分量组成,则随机变量Xm的特征函数表示如下:
其中,
(3-2)对于滑动窗口内所有不确定数据所有随机变量之和Y用特征函数表示;
随机变量之和Y是w个随机变量(X1,X2,…,Xw)的和,即则随机变量之和Y的特征函数表示如下:
(3-3)对于当前滑动窗口内的随机变量,基于旧的滑动窗口和旧的求和结果增量式更新当前滑动窗口内的随机变量之和的特征函数值;
针对当前滑动窗口内的数据基于旧的滑动窗口的特征函数处理新元组tj,新结果可按如下公式增量式计算:
与此同时,剔除旧元组tj-w,新结果可按如下公式增量式计算:
S304,根据概率求和的特征函数计算大于得分阈值τ的概率Pr(Yτ),若Pr(Yτ)δ,则输出查询结果为“是”,否则为“否”;当前滑动窗口的查询过程结束,跳至步骤(1)。
2.如权利要求1所述的不确定数据流概率求和阈值查询方法,其特征在于,步骤(1)中,获取不确定数据流中新的第j条不确定数据tj,以最新的w条数据形成滑动窗口其中w∈R+为滑动窗口长度,并以随机变量Xm表示滑动窗口中的第m个元组tj-w+m(1≤m≤w);
采用单变量的高斯混合模型对随机变量Xm进行建模,即用连续型随机变量来表示不确定数据,模型包含k个高斯变量以及对应的非负概率(p1,p2,…,pk);
随机变量X的概率密度函数为:
其中,μi和σi2为高斯变量的期望和方差,即:
3.如权利要求1所述的不确定数据流概率求和阈值查询方法,其特征在于,步骤(2)具体过程为:
(2-1)根据随机变量的期望和方差计算滑动窗口内所有随机变量之和的第一阶矩、第二阶矩、第一阶方差和第二阶方差;
(2-2)根据滑动窗口内所有随机变量之和的第一阶矩和第一阶方差与得分阈值和概率阈值的大小关系进行第一次过滤判断查询结果;
(2-3)在不能输出查询结果时,根据滑动窗口内所有随机变量之和的第二阶矩和第二阶方差与得分阈值和概率阈值的大小关系进行第二次过滤判断查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911106844.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电气工程用防乱线的接线箱及连接线
- 下一篇:一种降噪底脚及洗涤设备