[发明专利]一种基于改进k-means聚类算法的质心空间上采样算法在审

专利信息
申请号: 202110264357.0 申请日: 2021-03-11
公开(公告)号: CN112861993A 公开(公告)日: 2021-05-28
发明(设计)人: 王海勇;管维正;张开心 申请(专利权)人: 南京邮电大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 邵斌
地址: 210012 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 means 算法 质心 空间 采样
【权利要求书】:

1.一种基于改进k-means聚类算法的质心空间上采样算法,其特征是,包括:

使用k-means聚类算法对样本集进行聚类,并基于距离原则选择初始聚类中心;

基于给定的存储结构,计算样本集中各样本分别与各初始聚类中心的欧式距离,进而获取聚类簇;

基于获取的聚类簇,通过各聚类簇之间的欧氏距离计算出样本的初始质心,形成质心簇;

根据每个质心簇的欧氏距离计算出所有样本簇总的欧氏距离;

每个质心欧氏距离与样本总的欧氏距离的比值,得到权重系数;

权重系数和需要上采样的样本的乘积为每个质心簇的增加的样本数。

2.根据权利要求1所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述使用k-means聚类算法对样本集进行聚类指对小类样本进行聚类。

3.根据权利要求1所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述基于距离原则选择初始聚类中心,包括:

b-a、根据所有小类样本的坐标,所有样本的坐标相加求平均,得到小类样本集的重心记为O点;

b-b、选择距离重心O点最远的一点作为O1点,O1点为第一个初始聚类中心;

b-c、选距离O1点最远的一点作为O2点,O2点为第二个初始聚类中心;

b-d、选择到O1点和O2点距离和最大的点作为O3点,O3点为第三个初始聚类中心;

b-e、依此类推,得到k个初始聚类中心,其集合为{Q1,Q2,…,Qk}。

4.根据权利要求3所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述基于给定的存储结构,计算样本集中各样本分别与各初始聚类中心的欧式距离,进而获取聚类簇,包括:

c-b、分别计算每个样本分别与k个初始聚类中心{Q1,Q2,…,Qk}的欧氏距离;

c-c、选出每个样本到聚类中心点最近的距离L,并且记下距离最近的聚类中心点Qi

c-d、对每个样本都设计一种存储结构,样本Ci(L,Qi),其中L是样本Ci到最近聚类中心的距离,而Qi则是最近的聚类中心,可以理解为Ci属于Qi簇中,将样本信息保存到存储结构中;

c-e、所有样本信息都计算出来并且保存到存储结构中,根据每个样本到每个簇的坐标,通过平均每个样本坐标来重新计算聚类中心点;

c-f、重复以上操作,计算每个样本到新聚类中心点的距离L`;

c-g、如果L`小于或者等于L,则样本还是属于初始聚类中心点,只需要改变存储结构中的L,其他的不变;

c-h、如果L`大于L,则需要计算该样本到其他新聚类中心的欧氏距离,选择最小距离的点作为该样本的聚类中心点,并将该样本的存储结构信息更改,将聚类中心点换成现在新的聚类中心点,并且将样本到聚类中心点最近的距离修改为L`;

c-i、对于每个样本都重复以上步骤,计算出新的聚类中心点,迭代上述算法步骤,直到最后满足收敛标准。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110264357.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top