[发明专利]一种基于改进k-means聚类算法的质心空间上采样算法在审
申请号: | 202110264357.0 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112861993A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 王海勇;管维正;张开心 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 邵斌 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 means 算法 质心 空间 采样 | ||
1.一种基于改进k-means聚类算法的质心空间上采样算法,其特征是,包括:
使用k-means聚类算法对样本集进行聚类,并基于距离原则选择初始聚类中心;
基于给定的存储结构,计算样本集中各样本分别与各初始聚类中心的欧式距离,进而获取聚类簇;
基于获取的聚类簇,通过各聚类簇之间的欧氏距离计算出样本的初始质心,形成质心簇;
根据每个质心簇的欧氏距离计算出所有样本簇总的欧氏距离;
每个质心欧氏距离与样本总的欧氏距离的比值,得到权重系数;
权重系数和需要上采样的样本的乘积为每个质心簇的增加的样本数。
2.根据权利要求1所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述使用k-means聚类算法对样本集进行聚类指对小类样本进行聚类。
3.根据权利要求1所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述基于距离原则选择初始聚类中心,包括:
b-a、根据所有小类样本的坐标,所有样本的坐标相加求平均,得到小类样本集的重心记为O点;
b-b、选择距离重心O点最远的一点作为O1点,O1点为第一个初始聚类中心;
b-c、选距离O1点最远的一点作为O2点,O2点为第二个初始聚类中心;
b-d、选择到O1点和O2点距离和最大的点作为O3点,O3点为第三个初始聚类中心;
b-e、依此类推,得到k个初始聚类中心,其集合为{Q1,Q2,…,Qk}。
4.根据权利要求3所述的基于改进k-means聚类算法的质心空间上采样算法,其特征是,所述基于给定的存储结构,计算样本集中各样本分别与各初始聚类中心的欧式距离,进而获取聚类簇,包括:
c-b、分别计算每个样本分别与k个初始聚类中心{Q1,Q2,…,Qk}的欧氏距离;
c-c、选出每个样本到聚类中心点最近的距离L,并且记下距离最近的聚类中心点Qi;
c-d、对每个样本都设计一种存储结构,样本Ci(L,Qi),其中L是样本Ci到最近聚类中心的距离,而Qi则是最近的聚类中心,可以理解为Ci属于Qi簇中,将样本信息保存到存储结构中;
c-e、所有样本信息都计算出来并且保存到存储结构中,根据每个样本到每个簇的坐标,通过平均每个样本坐标来重新计算聚类中心点;
c-f、重复以上操作,计算每个样本到新聚类中心点的距离L`;
c-g、如果L`小于或者等于L,则样本还是属于初始聚类中心点,只需要改变存储结构中的L,其他的不变;
c-h、如果L`大于L,则需要计算该样本到其他新聚类中心的欧氏距离,选择最小距离的点作为该样本的聚类中心点,并将该样本的存储结构信息更改,将聚类中心点换成现在新的聚类中心点,并且将样本到聚类中心点最近的距离修改为L`;
c-i、对于每个样本都重复以上步骤,计算出新的聚类中心点,迭代上述算法步骤,直到最后满足收敛标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110264357.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能视频监控系统
- 下一篇:一种潜水式底部推流增氧机