[发明专利]一种改进的全局最优化k‑modes聚类方法在审

专利信息
申请号: 201710177995.2 申请日: 2017-03-23
公开(公告)号: CN107122793A 公开(公告)日: 2017-09-01
发明(设计)人: 黄昌浩;肖依永 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京慧泉知识产权代理有限公司11232 代理人: 王顺荣,唐爱华
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明一种改进的全局最优化k‑modes聚类方法,其步骤如下步骤一数据预处理;步骤二建立线性化的k‑modes数学规划模型;步骤三模型求解;步骤四结果输出;通过以上步骤,本发明完成了k‑modes算法聚类的目的,同时因为是线性的数学模型,所以到能求得全局最优解的效果,而且不用设置初始解,也避免的对于初始解敏感的问题,解决了传统k‑modes计算常见的两个问题。
搜索关键词: 一种 改进 全局 优化 modes 方法
【主权项】:
一种改进的全局最优化k‑modes聚类方法,其特征在于:其步骤如下:步骤一:数据预处理对需要被聚类分组的n个物体进行编号,编号值从1到n;用yij表示数据对象i的第j属性的取值;这里的分类型数据采用1,2,3…数字型分别进行代替;比如属性Aj,值域为Vj,具有qj个分类型数据,这时用{1,2,3…qj}分别表示各分类型属性值;记录需要聚类的数目;步骤二:建立线性化的k‑modes数学规划模型根据k‑modes算法思想把数据对象X聚集成l个簇,l≤n;其聚类标准就是找出l个聚类中心{C1,C2,…,Cl},使得每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;本发明建立了一个线性规划模型完成了k‑modes计算过程;其中所述的“建立了一个线性规划模型”,其建立做法如下:a)因为k‑mdoes是使每个数据对象与它最近的聚类中心的距离之和最小,并将这个组内距离和称之为目标函数;以这个为目标建立线性规划模型的目标函数,即把每个数据对象i和它簇中心k在每个属性j之间的距离进行加和;由此建立目标函数如下:minF(W,U)=Σk=1lΣi=1nΣj=1mdikj]]>b)为保证目标函数所建立的距离dikj满足要求,即在属性Aj上数据项目i与簇中心k的距离计算上,每个对象i当且仅当在属于簇中心k的类时,存在对象i与簇中心该属性的取值不同,距离dikj=1;建立约束条件(1);(1)c)规定簇中心的属性值的取值能要求:即簇中心每个属性只能取一个唯一确定的属性值,建立约束条件(2);(2)d)规定聚类分组的规则:根据每个数据对象i都必须且只能分配到一个类别里,建立约束条件(3);根据聚类结果需要被分成预先规定的l类,建立约束条件(4);(3)(4)e)因为输入的数据是以yij的形式表达对象i的第j属性的取值;但是这样的表达方法难以建立线性化模型,所以需要转化成一种新的形式,如决策变量xijt为一个取值0或1的参数,当数据对象i的第j属性取第t个分类属性值即yij=t时,xijt=1;由此建立约束条件(6);而且因为对象i的第j属性只能取一个值,所以由此建立约束条件(5);(5)(6)因此总结得出线性规划模型如下所示:目标函数:minF(W,U)=Σk=1lΣi=1nΣj=1mdikj]]>约束条件:(1)(2)(3)(4)(5)(6)以上所涉及到的符号,其含意全部从说明书中的符号表查得;步骤三:模型求解对上述模型进行求解,考虑利用商业软件进行模型求解,如Lingo好CPLEX,进行求解;由于本数学规划模型是线性的,完全具备最优解求解可行性;步骤四:结果输出通过模型求解,会得到最优的目标函数值;同时也会得到相应于该目标函数值的决策变量值wik和ukjt;依据定义由决策变量ukjt和wik确定了各个数据对象的聚类分组情况以及各类的簇中心;(1)对于所有i∈N观察wik,如果wik=1,则表示对象i隶属于k类;(2)如果ukjt=1,则第k簇的类中心的第j属性取第t个分类属性值;通过以上步骤,完成了k‑modes算法聚类的目的,同时因为是线性的数学模型,所以到能求得全局最优解的效果,而且不用设置初始解,也避免的对于初始解敏感的问题,解决了传统k‑modes计算常见的两个问题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710177995.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top