[发明专利]一种改进的全局最优化k‑中心点聚类方法在审
申请号: | 201710178344.5 | 申请日: | 2017-03-23 |
公开(公告)号: | CN107122794A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 朱川;肖依永 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京慧泉知识产权代理有限公司11232 | 代理人: | 王顺荣,唐爱华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种改进的全局最优化k‑中心点聚类方法,其步骤如下步骤一数据预处理准备;步骤二建立线性数学规划模型;步骤三线性数学规划模型求解;步骤四求解结果输出;通过以上步骤,本发明达到了对一组数据进行聚类分组的效果,使得同组数据的相似度较大,非同组数据的相似度较小;在聚类过程中,解决了传统聚类方法必须给出初始解,并且对于初始解过于敏感的问题;本发明可以在不给出初始解的情况下,直接获得最优聚类结果,大大提高了聚类过程的便利性与准确性。 | ||
搜索关键词: | 一种 改进 全局 优化 中心点 方法 | ||
【主权项】:
一种改进的全局最优化k‑中心点聚类方法,其特征在于:其步骤如下:步骤一:数据预处理准备1.1对需要被聚类分组的n个物体进行编号,编号值从1到n;以Vir表示对象i在属性r上的值;1.2按下面方法计算每两个对象i和j之间的距离dij,以获得距离矩阵D={dij}:1)计算对象i和j在属性r上的标准化距离,以dijr表示;2)当属性r为数字型属性时,令3)当属性k为分类型属性时,令4)令其中wr为属性r的权重;步骤二:建立线性数学规划模型依据聚类问题的特点并为了避免传统聚类方法对于初始解过于敏感的缺点,本发明建立了线性数学规划模型,该线性数学规划模型由目标函数与约束条件构成,其构成情况如下:目标函数:minF(Ω)=Σi=1nΣj=1ndij·ωij]]>约束条件:(1)(2)(3)ωij≤ωjj其中,上列线性数学规划模型中的符号即目标函数与约束条件中的符号,其含义如下所述:上述约束条件中,约束条件(1)表示每一个对象i都必须且仅能分属于某一个聚类j,满足有ωij=1;约束条件(2)表示必须有m个聚类;约束条件(3)表示仅当对象j为聚类中心时,ωij才允许取1,否则只能取0;上述数学规划模型是线性的,具备求解可行性;步骤三:线性数学规划模型求解其中线性数学规划模型指的是上文中所述,为包含目标函数与约束条件的线性数学规划模型;对该线性数学规划模型最优化求解,考虑下列已有的求解方式:(1)直接运用单纯形法、分支定界方法、割平面法等对模型进行最优求解;(2)利用求解软件,如Lingo和AMPL对模型进行最优化求解;具体求解方法如下:(1)若直接运用单纯形法、分支定界方法和割平面法对模型进行最优求解,则直接手工演算求解,不再赘述;(2)若利用求解软件,如Lingo和AMPL对模型进行最优化求解,则建立用于求解的执行脚本文件(*.dat),并将已知数据与线性数学规划模型相应的数据文件(*.dat)与模型文件(*.mod),一并带入软件进行求解,得到求解结果;步骤四:求解结果输出求解软件完成对线性数学规划模型求解计算后,获得求解结果Ω,并对其进行解析,获得聚类结果以及各类的中心点;方法如下:1)对于所有i∈N判断ωii,如果ωii=1,则表示对象i代表一个聚类且代表该类的中心点;2)如果ωii=1,则对所有j∈N判断ωij,如果ωij=1,则表对象j隶属于对象i所代表的类;根据上述方法,获得最终的聚类分组结果以及总簇内距离;通过以上步骤,达到了对一组数据进行聚类分组的效果,使得同组数据的相似度大,非同组数据的相似度小;在聚类过程中,解决了传统聚类方法必须给出初始解,并且对于初始解过于敏感的问题;本发明能在不给出初始解的情况下,直接获得最优聚类结果,大大提高了聚类过程的便利性与准确性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710178344.5/,转载请声明来源钻瓜专利网。