[发明专利]一种改进的全局最优化k‑modes聚类方法在审
申请号: | 201710177995.2 | 申请日: | 2017-03-23 |
公开(公告)号: | CN107122793A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 黄昌浩;肖依永 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京慧泉知识产权代理有限公司11232 | 代理人: | 王顺荣,唐爱华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 全局 优化 modes 方法 | ||
1.一种改进的全局最优化k-modes聚类方法,其特征在于:其步骤如下:
步骤一:数据预处理
对需要被聚类分组的n个物体进行编号,编号值从1到n;用yij表示数据对象i的第j属性的取值;这里的分类型数据采用1,2,3…数字型分别进行代替;比如属性Aj,值域为Vj,具有qj个分类型数据,这时用{1,2,3…qj}分别表示各分类型属性值;记录需要聚类的数目;
步骤二:建立线性化的k-modes数学规划模型
根据k-modes算法思想把数据对象X聚集成l个簇,l≤n;其聚类标准就是找出l个聚类中心{C1,C2,…,Cl},使得每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;本发明建立了一个线性规划模型完成了k-modes计算过程;其中所述的“建立了一个线性规划模型”,其建立做法如下:
a)因为k-mdoes是使每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;以这个为目标建立线性规划模型的目标函数,即把每个数据对象i和它簇中心k在每个属性j之间的距离进行加和;由此建立目标函数如下:
b)为保证目标函数所建立的距离dikj满足要求,即在属性Aj上数据项目i与簇中心k的距离计算上,每个对象i当且仅当在属于簇中心k的类时,存在对象i与簇中心该属性的取值不同,距离dikj=1;建立约束条件(1);
(1)
c)规定簇中心的属性值的取值能要求:即簇中心每个属性只能取一个唯一确定的属性值,建立约束条件(2);
(2)
d)规定聚类分组的规则:根据每个数据对象i都必须且只能分配到一个类别里,建立约束条件(3);根据聚类结果需要被分成预先规定的l类,建立约束条件(4);
(3)
(4)
e)因为输入的数据是以yij的形式表达对象i的第j属性的取值;但是这样的表达方法难以建立线性化模型,所以需要转化成一种新的形式,如决策变量xijt为一个取值0或1的参数,当数据对象i的第j属性取第t个分类属性值即yij=t时,xijt=1;由此建立约束条件(6);而且因为对象i的第j属性只能取一个值,所以由此建立约束条件(5);
(5)
(6)
因此总结得出线性规划模型如下所示:
目标函数:
约束条件:
(1)
(2)
(3)
(4)
(5)
(6)
以上所涉及到的符号,其含意全部从说明书中的符号表查得;
步骤三:模型求解
对上述模型进行求解,考虑利用商业软件进行模型求解,如Lingo好CPLEX,进行求解;由于本数学规划模型是线性的,完全具备最优解求解可行性;
步骤四:结果输出
通过模型求解,会得到最优的目标函数值;同时也会得到相应于该目标函数值的决策变量值wik和ukjt;依据定义由决策变量ukjt和wik确定了各个数据对象的聚类分组情况以及各类的簇中心;
(1)对于所有i∈N观察wik,如果wik=1,则表示对象i隶属于k类;
(2)如果ukjt=1,则第k簇的类中心的第j属性取第t个分类属性值;
通过以上步骤,完成了k-modes算法聚类的目的,同时因为是线性的数学模型,所以到能求得全局最优解的效果,而且不用设置初始解,也避免的对于初始解敏感的问题,解决了传统k-modes计算常见的两个问题。
2.根据权利要求1所述的一种改进的全局最优化k-modes聚类方法,其特征在于:
在步骤三中所述的“模型”,是指在步骤二所建立的目标函数与约束条件(1)~(6)所组成的线性规划模型;
在步骤三中所述的“模型求解”,选择利用AMPL语言调用CPLEX求解器求解模型,其求解具体做法如下:
(1)输入所需要聚类的数据以及聚类基本参数,建立AMPL数据文件xxx.dat;
(2)建立AMPL模型文件xxx.mod,建立线性规划模型;
(3)建立AMPL批处理文件xxx.sh;
(4)使用AMPL调用批处理文件xxx.sh,开始求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710177995.2/1.html,转载请声明来源钻瓜专利网。