[发明专利]一种基于模糊度量的k均值聚类的数据处理方法在审

申请号：	201610821369.8	申请日：	2016-09-14
公开（公告）号：	CN106446939A	公开（公告）日：	2017-02-22
发明（设计）人：	陆成刚	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	杭州斯可睿专利事务所有限公司33241	代理人：	王利强
地址：	310014 浙江省杭***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于模糊度量的k均值聚类的数据处理方法，包括以下步骤：1)初始化，在m个n维向量中随机取q个向量作为初始均值聚类中心，q为类型数目；2)对于每一个待聚类的向量计算到每一个均值中心的模糊度量的距离；3)对待聚类的该向量分配一个类号，类号取自于具与最小模糊度量距离的均值中心所在的类别；4)遍历各个待聚类向量，根据所属类号，分别计算具有相同类号的向量的平均向量，该平均向量更新作为新的均值中心；5)对于每一类别，计算当前均值中心与被更新的均值中心之间的模糊度量距离；6)如果前后均值中心的模糊度量距离均小于预设的阈值，则分类结束，否则回到2)继续。本发明更加符合人类主观的模糊性标准、准确性较好。
搜索关键词：	一种基于模糊度量均值数据处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于模糊度量的k均值聚类的数据处理方法，其特征在于：所述数据处理方法包括以下步骤：1)初始化，在m个n维向量中随机取q个向量作为初始均值聚类中心，q为类型数目；2)对于每一个待聚类的向量计算到每一个均值中心的模糊度量的距离；设第h类的均值中心为(Mh1,Mh2,...,Mhn)T，某向量为计算该两个向量之间的模糊度量的距离的过程如下：2.1)计算两个向量的差，并取1范数，得到如下的向量分布(|Mh1-xi1~|,|Mh2-xi2~|,...,|Mhn-xin~|)T]]>2.2)对上述结果向量的分量作由小到大的排序，得到(a1,a2,...,an)其中a1≤a2≤...≤an且l＝1,2,...,n；1≤r1,r2,...,rn≤n2.3)从(a1,a2,...,an)各分量里取出相异的t个数值，计算其中，表示(a1,a2,...,an)各分量不小于的个数，当各个{al}相异时，即取ai和中的较小者；2.4)最后得到模糊度量的距离数值为measure＝max{b1,b2,...,bt}即所有{bi}中的最大值；3)对待聚类的该向量分配一个类号，类号取自于具与最小模糊度量距离的均值中心所在的类别；4)遍历各个待聚类向量，根据所属类号，分别计算具有相同类号的向量的平均向量，该平均向量更新作为新的该类的均值中心；5)对于每一类别，计算当前均值中心与被更新的均值中心之间的模糊度量距离；6)对于每一类别，如果前后均值中心的模糊度量距离均小于预设的阈值，则分类结束，否则回到2)继续。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610821369.8/，转载请声明来源钻瓜专利网。

上一篇：带式输送机前瞻自诊断方法及系统
下一篇：一种基于支持向量机的超级电容器电容值退化趋势的预测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于模糊度量的k均值聚类的数据处理方法在审

专利文献下载