[发明专利]一种边界数据划分方法与设备有效
申请号: | 201610427861.7 | 申请日: | 2016-06-16 |
公开(公告)号: | CN107516101B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 王曜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健;周建华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 边界 数据 划分 方法 设备 | ||
1.一种边界数据划分方法,其中,该方法用于对用户数据的聚类结果中的边界数据进行划分,包括:
根据聚类结果中关联聚类群组的无争议数据获取边界数据的关联高密度区间,所述关联聚类群组为多个与所述边界数据的相似度相同的聚类群组;
在所述关联聚类群组的无争议数据中截取处于所述关联高密度区间内的集中数据;
获取所述边界数据与所述关联聚类群组的集中数据的相似度;
根据所述相似度将所述边界数据划分至所述关联聚类群组中的目标聚类群组中,作为所述目标聚类群组的无争议数据,以更新所述聚类结果。
2.根据权利要求1所述的方法,其中,根据关联聚类群组的无争议数据获取边界数据的关联高密度区间之前,还包括:
通过聚类算法对样本数据进行聚类处理,获取聚类结果,其中,所述聚类结果包含多个聚类群组的无争议数据以及与至少两个聚类群组的相似度相同的边界数据。
3.根据权利要求1所述的方法,其中,根据关联聚类群组的无争议数据获取边界数据的关联高密度区间,包括:
将关联聚类群组中无争议数据的标准差作为对应关联高密度区间的上限值,以及根据关联聚类群组中无争议数据的数量确定对应关联高密度区间的下限值。
4.根据权利要求1所述的方法,其中,获取所述边界数据与所述关联聚类群组的集中数据的相似度,包括:
获取所述关联聚类群组的集中数据的中位数数据;
获取所述边界数据与所述中位数数据的欧式距离;
根据所述欧式距离确定所述边界数据与所述关联聚类群组的集中数据的相似度。
5.根据权利要求1所述的方法,其中,根据所述相似度将所述边界数据划分至所述关联聚类群组中的目标聚类群组中,作为所述目标聚类群组的无争议数据,以更新所述聚类结果,包括:
若所述相似度中仅存在一个最高值,将所述最高值所对应的聚类群组作为目标聚类群组,并将所述边界数据划分至所述目标聚类群组中,作为所述目标聚类群组的无争议数据,以更新所述聚类结果。
6.根据权利要求5所述的方法,其中,该方法还包括:
若所述相似度中存在多个相同的最高值,将所述最高值所对应的聚类群组更新为所述边界数据的关联聚类群组,以更新所述聚类结果。
7.根据权利要求1至6中任一项所述的方法,其中,在更新所述聚类结果之后,还包括:
若所述聚类结果中无边界数据,输出所述聚类结果。
8.一种边界数据划分设备,其中,该设备用于对用户数据的聚类结果中的边界数据进行划分,包括:
获取装置,用于根据聚类结果中关联聚类群组的无争议数据获取边界数据的关联高密度区间,所述关联聚类群组为多个与所述边界数据的相似度相同的聚类群组;
截取装置,用于在所述关联聚类群组的无争议数据中截取处于所述关联高密度区间内的集中数据;
相似度分析装置,用于获取所述边界数据与所述关联聚类群组的集中数据的相似度;
划分装置,用于根据所述相似度将所述边界数据划分至所述关联聚类群组中的目标聚类群组中,作为所述目标聚类群组的无争议数据,以更新所述聚类结果。
9.根据权利要求8所述的设备,其中,该设备还包括:
聚类处理装置,用于在根据关联聚类群组的无争议数据获取边界数据的关联高密度区间之前,通过聚类算法对样本数据进行聚类处理,获取聚类结果,其中,所述聚类结果包含多个聚类群组的无争议数据以及与至少两个聚类群组的相似度相同的边界数据。
10.根据权利要求8所述的设备,其中,所述获取装置,用于将关联聚类群组中无争议数据的标准差作为对应关联高密度区间的上限值,以及根据关联聚类群组中无争议数据的数量确定对应关联高密度区间的下限值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610427861.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种字符识别方法及装置
- 下一篇:图像数据分类与建立分类模型方法、装置及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置