[发明专利]一种基于稀疏均值的模糊聚类方法有效

申请号：	201610629774.X	申请日：	2016-08-02
公开（公告）号：	CN106295688B	公开（公告）日：	2019-10-18
发明（设计）人：	梅建萍	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	杭州赛科专利代理事务所(普通合伙) 33230	代理人：	郭薇
地址：	310014 ***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于稀疏均值的模糊聚类方法，将待聚类的文档用向量空间模型表示为高维稀疏向量，设置参数，初始化均值，基于当前均值更新所有隶属度的值，更新权重，然后基于隶属度更新对应的均值，当对应的均值不再变化或迭代次数最大时迭代结束，输出聚类结果，否则重复。本发明通过稀疏均值使得均值也就是类中心点和样本点一样具有局域稀疏特性，增加基于样本点和均值欧氏距离来描述样本点和类相似性的有效性，在时间上更加高效，产生具有稀疏特性的均值使得类中心点更加自然地代表稀疏样本点的特性，同时为了增加对均值的稀疏性的控制，还在目标函数中加入均值范数的正则项以得到新的最小化目标函数，使得可以更加快速的求解。
搜索关键词：	一种基于稀疏均值模糊方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于稀疏均值的模糊聚类方法，其特征在于：所述方法包括以下步骤：步骤1.1：将待聚类的文档用向量空间模型表示为高维稀疏向量X＝{x₁,x₂,…x_n}，其中每个样本点为s维向量，即x_i∈R^s，s＞0，1≤i≤n；n为样本总数，n＞0；步骤1.2：设置参数，所述参数包括类数k、模糊化系数m、初始正则项权重β⁰、结束判断参数ε及最大迭代次数T；0＜k＜n，1＜m＜2；β⁰＞0；设定带有均值l₁范数正则项的最小化目标函数其中，u_ci表示第i个样本到第c个类的隶属度，δ_c表示第c个类的均值；步骤1.3：初始化均值，得到与最后结果相近的k个初始均值分别为[δ₁,δ₂,…δ_k]；计迭代次数l＝1；步骤1.4：基于当前均值，利用式更新所有隶属度的值，1≤c≤k；步骤1.5：对每一类c＝1,2,…,k，更新权重β，然后基于步骤1.4的隶属度u_ci，采用式更新对应的k个均值，其中，sign(δ′_c)返回该向量中对应元素的符号；步骤1.6：当对应的k个均值不再变化或迭代次数l＞T，迭代结束；否则重复步骤1.3；步骤1.7：输出聚类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610629774.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于稀疏均值的模糊聚类方法有效

专利文献下载