[发明专利]一种基于元组不确定性的数据流有效聚类方法无效
申请号: | 201210050116.7 | 申请日: | 2012-02-29 |
公开(公告)号: | CN102646126A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 刘东升;琚春华;张鹏坤;周怡;陈庭贵;王蓓;王冰 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;王利强 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
一种基于元组不确定性的数据流有效聚类方法,包括以下步骤:1)初始化:将内存划分为两个区域:主缓冲区BUFM和副缓冲区BUFV,分别存放“正常”元组和“离群”元组的微簇信息,将BUFM和BUFV初始化为空;2)寻找归属簇:对于元组存在性不确定的数据流S={<v1,p1>,L,<vk,pk>,L}中每个到达的新元组 |
||
搜索关键词: | 一种 基于 不确定性 数据流 有效 方法 | ||
【主权项】:
1.一种基于元组不确定性的数据流有效聚类方法,其特征在于:包括以下步骤:1)初始化将内存划分为两个区域:主缓冲区BUFM和副缓冲区BUFV,分别存放“正常”元组和“离群”元组的微簇信息,将BUFM和BUFV初始化为空;2)寻找归属簇对于元组存在性不确定的数据流S={<v1,p1>,L,<vk,pk>,L}中每个到达的新元组
分别在主缓冲区和副缓冲区中为其寻找接受的簇;2.1),在主候选区内为新元组
寻找归属簇,包括以下步骤:Step1:如果主缓冲区没满,即候选区内微簇的个数小于主缓冲区的规模nm(|BUFM|<nm),那么创建仅包含
元组的微簇,并加入到BUFM中;Step2:如果候选区已满,则运用如下规则为其选取归属簇:设C={C1,C2,L,Cn}为现有簇的集合,簇Ci(1≤i≤n)的元组数为ni,Ci加入新元组
后变成簇Ci′,di(1≤i≤n)为
与各簇Ci中心的距离,其中dmin=min{d1,d2,L,dn},dmin对应的簇为Cmin;APc代表簇的存在概率,为簇中所有元组概率的代数平均值,根据APc的大小做如下定义,将簇分为强簇、弱簇和过渡簇三种簇,预设参数α,0<α≤1,如果簇满足APC≥α,则称簇为强簇;如果簇的存在概率小于某一阈值β的簇,即APC<β,则称簇为弱簇,其中,β满足
介于弱簇与强簇之间的簇为弱簇,即满足β≤APc<α;规则1:将待选区域中的簇C={C1,C2,L,Cn}按di大小非递减排列,形成新的簇序列C′={Ck1,Ck2,L,Ckn},其中Ck1即为Cmin;对簇集合C′按顺序扫描,选取满足
的m个簇Cki(1≤i≤m)列为候选簇集合C″={Ck1,Ck2,L,Ckm};规则2:若规则1不满足,则对簇集合C″按顺序扫描,将满足如下条件并且第一次遇到的簇Cki列为归属簇:Cki是过渡簇,Cki′为强簇;规则3:若规则2不满足,则对簇集合C″按顺序扫描,将满足如下条件并且第一次遇到的簇Cki列为归属簇:Cki是强簇,Cki′仍为强簇;规则4:扫描簇集合C″,计算
的值,选取最大者的簇Cki为归属簇;Step3:判断新元组
与候选簇Cki的距离是否小于Cki的τ倍,如果小于,则归属簇吸收新的元组
更新微簇信息;否则转入步骤2.2);2.2),在副缓冲区内为新元组
寻找归属簇;2.3),如果在主缓冲区和副缓冲区内均未找到
的归属簇,则将其作为全局离群点删除;3)更新维护微簇信息,包括以下步骤:Step1:衰减操作:设微簇u包含n个元组{(vi,pi)}分别在t1,L,tn到达,则在t时刻,u的权重为
其中λ为衰减速率,其值越大,衰减越快;Step2:删除过于陈旧的微簇:设微簇u的权重比为w(u)/APC,当两个区域中存在某个微簇,其权重低于预设参数ρ,则从缓冲区中删除该簇;Step3:簇交换机制:当主缓冲区内最小的微簇权重小于副缓冲区内最大的微簇权重时,即min(w(u)|u∈BUFM)<max(w(u)|u∈BUFV),则在两个缓冲区间内交换相应微簇,使得在主缓冲区内所有的微簇权重均比副缓冲区内任何一个微簇的权重高;Step4:填充主缓冲区:如果BUFM未满,且BUFV非空,则将BUFV内权重值等于max(w(u)|u∈BUFV)的微簇移到BUFM中,直至充满主缓冲区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210050116.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种火腿肠式蚕宝宝饲料的制作方法
- 下一篇:FSK解调电路