[发明专利]基于多智能体进化的聚类和离群点检测方法在审

专利信息
申请号: 201610846226.2 申请日: 2016-09-23
公开(公告)号: CN106649456A 公开(公告)日: 2017-05-10
发明(设计)人: 刘静;焦李成;陈德学 申请(专利权)人: 西安电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 陕西电子工业专利中心61205 代理人: 田文英,王品华
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多智能体进化的聚类和离群点检测方法,本发明主要解决现有传统的基于聚类的离群点检测算法在不同密度的数据集上,对高效率数据聚类的离群点检测的问题。其实现步骤是1、初始化;2、对每个智能体执行K‑means聚类算法;3、计算智能体的能量;4、执行邻域竞争算子;5、执行邻域交叉算子;6、执行变异算子;7、执行K‑means聚类算法;8、执行自学习算子;9、更新全局最优智能体;10、离群点检测;11、得到判定结果;12、输出离群点数据;13、输出带类别的数据点。本发明在不同的密度数据,有效地提高了聚类效率,离群点检测精度,减少计算时间,可应用于不同密度的数据集。
搜索关键词: 基于 智能 进化 离群 检测 方法
【主权项】:
一种基于多智能体进化的聚类和离群点检测方法,包括如下步骤:(1)初始化:(1a)从待检测数据集中随机选择满足智能体的聚类个数,对网格中的每个智能体进行实数编码,每个智能体代表一条染色体,每个聚类中心的位置代表一个基因,完成网格的初始化;(1b)将待检测数据集中的所有点设定为非离群点;(1c)将离群点数据集设定为空集;(1d)将初次迭代次数设定为0,最大迭代次数设定为100;(2)对每个智能体执行K‑means聚类算法:(2a)从待检测数据集中任选一个点作为待计算点;(2b)利用欧式距离公式,计算待计算点到每一个聚类中心的距离;(2c)将每一个待检测数据集中的点,分配到与聚类中心距离最近的类;(2d)判断是否选完待检测数据集中所有的点,若是,执行步骤(3),否则,则执行步骤(2a);(3)计算智能体的能量:(3a)按照适应度计算公式,计算每个智能体的适应度值,将每个智能体的适应度值作为该智能体的能量:(3b)将网格上搜索到能量最大的智能体,作为全局最优智能体;(4)执行邻域竞争算子:(4a)利用智能体更新方法,对网格中的每个智能体进行更新,获得新的智能体;(4b)将新的智能体的能量和周围能量最大的智能体的能量进行比较,用二者中能量大的智能体代替原来的智能体;(5)执行邻域交叉算子:对网格中的每个智能体执行邻域交叉算子,获得邻域交叉后的智能体;(6)执行变异算子:对网格中的每个智能体执行变异算子,获得变异后的智能体;(7)执行K‑means聚类算法:(7a)从邻域交叉后的智能体和变异后的智能体任选一个智能体,作为待聚类的智能体;(7b)利用欧式距离公式,计算每一个非离群点到待聚类的智能体中每一个聚类中心的距离;(7c)将每一个非离群点分配到该点与待聚类的智能体的聚类中心距离最近的类;(7d)利用适应度计算公式,计算待聚类的智能体的能量;(7e)判断是否选完所有邻域交叉后的智能体和变异后的智能体,若是,执行步骤(8),否则,执行步骤(7a);(8)执行自学习算子:(8a)从当前网格中找出能量最大的智能体,作为当前最优智能体;(8b)将自学习算子的初次迭代次数设定为0;(8c)利用智能体更新方法,对当前最优智能体进行更新,得到临时最优智能体;(8d)利用欧式距离公式,计算每一个非离群点到临时最优智能体中每一个聚类中心的距离;(8e)将每一个非离群点分配到该点与临时最优智能体的聚类中心距离最近的类;(8f)利用适应度计算公式,计算临时最优智能体的能量;(8g)将临时最优的智能体赋予当前最优智能体;(8h)判断当前自学习算子的迭代次数是否大于10,若是,则执行步骤(8k),否则,执行步骤(8j);(8j)将自学习算子的迭代次数加1,执行步骤(8c);(8k)输出当前最优智能体;(9)更新全局最优智能体:(9a)将当前最优智能体和全局最优智能体能量大的智能体赋予临时全局最优智能体;(9b)将临时全局最优的智能体赋予全局最优的智能体,作为下一代的全局最优智能体;(9d)将所有待检测的数据点设定为非离群点;(9e)清空离群点数据集;(9f)利用欧式距离公式,计算每一个非离群点到全局最优智能体中聚类中心的距离;(9g)根据全局最优智能体中聚类的中心位置,将每一个非离群点分配到与全局最优智能体中聚类中心距离最近的类;(10)检测离群点:(10a)采用局部离群程度计算方法,计算全局最优智能体中的聚类中的每一个点的局部离群程度值;(10b)将全局最优智能体中的聚类中的每一个带类别和局部离群程度值的点存入到临时待排序数据集中;(10c)将临时待排序数据集中的点的局部离群程度值,按从大到小的顺序进行排序;(10d)根据待检测数据集中的离群点的个数,将临时待排序数据集中的排在最前的相应的离群点的个数标注为离群点,并存入离群点数据集中;(11)判断当前的迭代次数是否大于最大迭代次数,若是,则执行步骤(12),否则执行步骤(4);(12)输出离群点数据集中的离群点数据;(13)将临时数据集中未标注离群点的点按照类别输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610846226.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top