[发明专利]一种改进的全局最优化k‑modes聚类方法在审

专利信息
申请号: 201710177995.2 申请日: 2017-03-23
公开(公告)号: CN107122793A 公开(公告)日: 2017-09-01
发明(设计)人: 黄昌浩;肖依永 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京慧泉知识产权代理有限公司11232 代理人: 王顺荣,唐爱华
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 改进 全局 优化 modes 方法
【权利要求书】:

1.一种改进的全局最优化k-modes聚类方法,其特征在于:其步骤如下:

步骤一:数据预处理

对需要被聚类分组的n个物体进行编号,编号值从1到n;用yij表示数据对象i的第j属性的取值;这里的分类型数据采用1,2,3…数字型分别进行代替;比如属性Aj,值域为Vj,具有qj个分类型数据,这时用{1,2,3…qj}分别表示各分类型属性值;记录需要聚类的数目;

步骤二:建立线性化的k-modes数学规划模型

根据k-modes算法思想把数据对象X聚集成l个簇,l≤n;其聚类标准就是找出l个聚类中心{C1,C2,…,Cl},使得每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;本发明建立了一个线性规划模型完成了k-modes计算过程;其中所述的“建立了一个线性规划模型”,其建立做法如下:

a)因为k-mdoes是使每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;以这个为目标建立线性规划模型的目标函数,即把每个数据对象i和它簇中心k在每个属性j之间的距离进行加和;由此建立目标函数如下:

min F(W,U)=Σk=1lΣi=1nΣj=1mdikj]]>

b)为保证目标函数所建立的距离dikj满足要求,即在属性Aj上数据项目i与簇中心k的距离计算上,每个对象i当且仅当在属于簇中心k的类时,存在对象i与簇中心该属性的取值不同,距离dikj=1;建立约束条件(1);

(1)

c)规定簇中心的属性值的取值能要求:即簇中心每个属性只能取一个唯一确定的属性值,建立约束条件(2);

(2)

d)规定聚类分组的规则:根据每个数据对象i都必须且只能分配到一个类别里,建立约束条件(3);根据聚类结果需要被分成预先规定的l类,建立约束条件(4);

(3)

(4)

e)因为输入的数据是以yij的形式表达对象i的第j属性的取值;但是这样的表达方法难以建立线性化模型,所以需要转化成一种新的形式,如决策变量xijt为一个取值0或1的参数,当数据对象i的第j属性取第t个分类属性值即yij=t时,xijt=1;由此建立约束条件(6);而且因为对象i的第j属性只能取一个值,所以由此建立约束条件(5);

(5)

(6)

因此总结得出线性规划模型如下所示:

目标函数:

min F(W,U)=Σk=1lΣi=1nΣj=1mdikj]]>

约束条件:

(1)

(2)

(3)

(4)

(5)

(6)

以上所涉及到的符号,其含意全部从说明书中的符号表查得;

步骤三:模型求解

对上述模型进行求解,考虑利用商业软件进行模型求解,如Lingo好CPLEX,进行求解;由于本数学规划模型是线性的,完全具备最优解求解可行性;

步骤四:结果输出

通过模型求解,会得到最优的目标函数值;同时也会得到相应于该目标函数值的决策变量值wik和ukjt;依据定义由决策变量ukjt和wik确定了各个数据对象的聚类分组情况以及各类的簇中心;

(1)对于所有i∈N观察wik,如果wik=1,则表示对象i隶属于k类;

(2)如果ukjt=1,则第k簇的类中心的第j属性取第t个分类属性值;

通过以上步骤,完成了k-modes算法聚类的目的,同时因为是线性的数学模型,所以到能求得全局最优解的效果,而且不用设置初始解,也避免的对于初始解敏感的问题,解决了传统k-modes计算常见的两个问题。

2.根据权利要求1所述的一种改进的全局最优化k-modes聚类方法,其特征在于:

在步骤三中所述的“模型”,是指在步骤二所建立的目标函数与约束条件(1)~(6)所组成的线性规划模型;

在步骤三中所述的“模型求解”,选择利用AMPL语言调用CPLEX求解器求解模型,其求解具体做法如下:

(1)输入所需要聚类的数据以及聚类基本参数,建立AMPL数据文件xxx.dat;

(2)建立AMPL模型文件xxx.mod,建立线性规划模型;

(3)建立AMPL批处理文件xxx.sh;

(4)使用AMPL调用批处理文件xxx.sh,开始求解。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710177995.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top