[发明专利]一种基于元组不确定性的数据流有效聚类方法无效

专利信息
申请号: 201210050116.7 申请日: 2012-02-29
公开(公告)号: CN102646126A 公开(公告)日: 2012-08-22
发明(设计)人: 刘东升;琚春华;张鹏坤;周怡;陈庭贵;王蓓;王冰 申请(专利权)人: 浙江工商大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 王兵;王利强
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于元组不确定性的数据流有效聚类方法,包括以下步骤:1)初始化:将内存划分为两个区域:主缓冲区BUFM和副缓冲区BUFV,分别存放“正常”元组和“离群”元组的微簇信息,将BUFM和BUFV初始化为空;2)寻找归属簇:对于元组存在性不确定的数据流S={<v1,p1>,L,<vk,pk>,L}中每个到达的新元组分别在主缓冲区和副缓冲区中为其寻找接受的簇;3)更新维护微簇信息,包括以下步骤:Step1:衰减操作;Step2:删除过于陈旧的微簇;Step3:簇交换机制;Step4:填充主缓冲区。本发明考虑到元组的存在性的不确定性、提升聚类质量、处理速度很快。
搜索关键词: 一种 基于 不确定性 数据流 有效 方法
【主权项】:
1.一种基于元组不确定性的数据流有效聚类方法,其特征在于:包括以下步骤:1)初始化将内存划分为两个区域:主缓冲区BUFM和副缓冲区BUFV,分别存放“正常”元组和“离群”元组的微簇信息,将BUFM和BUFV初始化为空;2)寻找归属簇对于元组存在性不确定的数据流S={<v1,p1>,L,<vk,pk>,L}中每个到达的新元组分别在主缓冲区和副缓冲区中为其寻找接受的簇;2.1),在主候选区内为新元组寻找归属簇,包括以下步骤:Step1:如果主缓冲区没满,即候选区内微簇的个数小于主缓冲区的规模nm(|BUFM|<nm),那么创建仅包含元组的微簇,并加入到BUFM中;Step2:如果候选区已满,则运用如下规则为其选取归属簇:设C={C1,C2,L,Cn}为现有簇的集合,簇Ci(1≤i≤n)的元组数为ni,Ci加入新元组后变成簇Ci′,di(1≤i≤n)为与各簇Ci中心的距离,其中dmin=min{d1,d2,L,dn},dmin对应的簇为Cmin;APc代表簇的存在概率,为簇中所有元组概率的代数平均值,根据APc的大小做如下定义,将簇分为强簇、弱簇和过渡簇三种簇,预设参数α,0<α≤1,如果簇满足APC≥α,则称簇为强簇;如果簇的存在概率小于某一阈值β的簇,即APC<β,则称簇为弱簇,其中,β满足介于弱簇与强簇之间的簇为弱簇,即满足β≤APc<α;规则1:将待选区域中的簇C={C1,C2,L,Cn}按di大小非递减排列,形成新的簇序列C′={Ck1,Ck2,L,Ckn},其中Ck1即为Cmin;对簇集合C′按顺序扫描,选取满足的m个簇Cki(1≤i≤m)列为候选簇集合C″={Ck1,Ck2,L,Ckm};规则2:若规则1不满足,则对簇集合C″按顺序扫描,将满足如下条件并且第一次遇到的簇Cki列为归属簇:Cki是过渡簇,Cki′为强簇;规则3:若规则2不满足,则对簇集合C″按顺序扫描,将满足如下条件并且第一次遇到的簇Cki列为归属簇:Cki是强簇,Cki′仍为强簇;规则4:扫描簇集合C″,计算的值,选取最大者的簇Cki为归属簇;Step3:判断新元组与候选簇Cki的距离是否小于Cki的τ倍,如果小于,则归属簇吸收新的元组更新微簇信息;否则转入步骤2.2);2.2),在副缓冲区内为新元组寻找归属簇;2.3),如果在主缓冲区和副缓冲区内均未找到的归属簇,则将其作为全局离群点删除;3)更新维护微簇信息,包括以下步骤:Step1:衰减操作:设微簇u包含n个元组{(vi,pi)}分别在t1,L,tn到达,则在t时刻,u的权重为其中λ为衰减速率,其值越大,衰减越快;Step2:删除过于陈旧的微簇:设微簇u的权重比为w(u)/APC,当两个区域中存在某个微簇,其权重低于预设参数ρ,则从缓冲区中删除该簇;Step3:簇交换机制:当主缓冲区内最小的微簇权重小于副缓冲区内最大的微簇权重时,即min(w(u)|u∈BUFM)<max(w(u)|u∈BUFV),则在两个缓冲区间内交换相应微簇,使得在主缓冲区内所有的微簇权重均比副缓冲区内任何一个微簇的权重高;Step4:填充主缓冲区:如果BUFM未满,且BUFV非空,则将BUFV内权重值等于max(w(u)|u∈BUFV)的微簇移到BUFM中,直至充满主缓冲区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210050116.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top