[发明专利]一种数据聚类处理方法在审
申请号: | 202010587823.4 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111753905A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 谢金柱;邹国斌;耿蓉 | 申请(专利权)人: | 知舟信息科技(镇江)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 尹均利 |
地址: | 212000 江苏省镇*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 处理 方法 | ||
本发明涉及一种数据聚类处理方法,属于人工鱼群算法领域,本发明包括对标准人工鱼群算法(AFSA)的改进与人工鱼群算法(AFSA)和K‑means算法混合进行数据聚类处理;针对K‑MEANS算法存在初始聚类中心点难以确定的缺陷,引入人工鱼群算法;针对人工鱼群算法中鱼群在觅食行为中随机性过大、聚群行为中围绕最优解以及追尾行为的盲目性问题分别进行改进,减少了个体鱼随机搜索的迂回现象和追尾行为中的盲目性,并允许聚群行为中忽略拥挤度因子,达到快速收敛到全局最优解。
技术领域
本发明涉及人工鱼群算法技术领域,具体为一种数据聚类处理方法。
背景技术
聚类是一种常用的数据挖掘方法,在进行数据挖掘前,数据库本身大量的数据杂乱无章,数据的性质、类型、表达方式千差万别,为了将这些复杂的数据简约化、明晰化,需要使用聚类来梳理数据,以便根据需求快速地筛选出所需数据,只对有需求的数据进行储存和管理,并且在实际应用中还可根据需求对数据处理对象进行快速响应和改变,为使用者的各种经营活动提供重要的参考信息,满足客户实际需求;
聚类的数学描述如下:
令S={x1,x2,x3,...,xn}表示为数量为n个对象的集合,xi表示集合中第i个对象,
Dk表示第k个簇(k={1,2,3,...,m}),用R(xi,xj)表示两个对象问的相似性,则每一个簇需要满足下列条件:
但是目前广泛使用的K-MEANS算法存在初始聚类中心点难以确定的缺陷,影响力实际工作效率,因此针对此缺陷引入人工鱼群算法,而鱼群存在有觅食行为中随机性过大、聚群行为出现的迂回问题以及追尾行为的盲目性问题,需针对性进行改进。
发明内容
针对K-MEANS算法存在初始聚类中心点难以确定的缺陷问题,本发明公开了一种数据聚类处理方法。
本发明技术方案是:一种数据聚类处理方法,包括如下步骤:
(1)设定种群数量n,视野visual,步长step,尝试次数try,拥挤度因子,迭代次数T,目标函数f(x),交叉概率C;
(2)初始化人工鱼群;
(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W,并以公式计算步长step、视野visual,根据分组不同计算尝试次数try;
(4)进行追尾和聚群行为;
(5)比对追尾行为和聚群行为产生的适用度值,择优选择,跳转至步骤(6);若未找到,则进入觅食行为向周遭尝试,若有较优状态则向其移动,若达到尝试次数try,则令flagi为个体鱼i的历史移动标志位,并记录该个体探查到的历史最优状态,通过历史标志位和历史较优状态的记录,对在局部较优状态处迂回的个体鱼进行标记,不再向该方向移动,而随机选择其他方向,直到找到优于记录的历史较优状态;
(6)将个体鱼执行行为所得到的结果与公告板上的历史最大适应度值相比,若大于公告板所记录则进行替换,否则保持;
(7)判断是否得到目标解,若得到则转向步骤(9),若没有则继续迭代;
(8)判断迭代是否达到上限,若是转步骤(9),若未迭代完成则转步骤(3);
(9)将当前最优解作为K-means算法的初始聚类中心进行数据处理;
(10)算法终止。
所述方法的具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于知舟信息科技(镇江)有限公司,未经知舟信息科技(镇江)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010587823.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置