[发明专利]一种高效的并行不确定性数据聚类方法在审

专利信息
申请号: 201910334513.9 申请日: 2019-04-24
公开(公告)号: CN110059142A 公开(公告)日: 2019-07-26
发明(设计)人: 吴翠先;何少元;何登平 申请(专利权)人: 重庆邮电大学
主分类号: G06F16/28 分类号: G06F16/28;G06F16/27;G06F16/2458;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 400065*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 不确定性数据 聚类 距离度量 并行 并行计算 构建 不确定性 负载均衡 高效运行 聚类算法 模型实现 统计信息 最小边界 数据集 点数 推导 度量 分区 均衡 引入 分析
【权利要求书】:

1.一种高效的并行不确定性数据聚类方法,其特征在于,包括数据的不确定性度量与表示、不确定性数据间的距离度量、构建串行的不确定性数据聚类方法、数据分区划分、构建高效的并行不确定性数据聚类方法。

2.根据权利要求1所述的不确定性数据聚类方法,其特征在于,所述数据的不确定性度量与表示具体为:利用区间数结合不确定性数据对象的统计信息(均值与标准差)来有效合理的对不确定性数据进行描述。首先获取不确定性数据对象的n为均值向量与标准误差向量引入包含因子k后,依据区间数的中点半径表示方式,将不确定数据对象表示为R表示实数。

3.根据权利要求1所述的不确定性数据聚类方法,其特征在于,所述的不确定性数据间的距离度量具体为:不确定性数据对象经过区间数表示后,该对象便看作为一个区间数;在距离度量时,区间数间距离存在最大值与最小值,即区间数间的距离仍然是一个区间数;数据对象M,N之间的距离可表示为:

D(M,N)min表示数据对象M,N之间,距离的最小值、D(M,N)max表示数据对象M,N之间,距离的最大值;为了可以有效合理的将距离度量与聚类算法结合起来,引入相关系数λ{λ∈R|0≤λ≤1},把不确定性数据之间距离的最小值与最大值结合起来;那么不确定性数据对象M,N之间的距离可表示为:

由此得到的不确定性数据对象间的距离满足非负性和对称性。

4.根据权利要求1所述的不确定性数据聚类方法,其特征在于,所述构建串行的不确定性数据聚类方法具体为:将数据的不确定性度量与表示、不确定性数据间的距离度量引入到聚类算法OPTICS中,构建出串行的不确定性数据的聚类方法。

5.根据权利要求1所述的不确定性数据聚类方法,其特征在于,所述的数据分区划分方法,从数据差异度最大的前K维度寻找最佳分片,保证高效运行。

6.根据权利要求1所述的不确定性数据聚类方法,其特征在于,所述的构建高效的并行不确定性数据,从Map、Reduce、Merge result、Relabel过程实现并行高效计算。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910334513.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top