[发明专利]面向大数据领域的膜计算数据细胞聚类方法在审

专利信息
申请号: 201910692297.5 申请日: 2019-07-30
公开(公告)号: CN110533073A 公开(公告)日: 2019-12-03
发明(设计)人: 陆佳炜;赵伟;周焕;吴涵;张元鸣;肖刚 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/00;G06N3/12
代理公司: 33241 杭州斯可睿专利事务所有限公司 代理人: 王利强<国际申请>=<国际公布>=<进入
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 算法 预处理 有效的结合 计算数据 进化机制 聚类结果 聚类算法 模糊聚类 遗传算法 预定数据 大数据 结合膜 数据簇 聚类 加权 进化 细胞
【权利要求书】:

1.一种面向大数据领域的膜计算数据细胞聚类方法,其特征在于,所述方法包括以下步骤:

第一步、形式化定义;

第二步、在不同的数据细胞中实施不同的进化规则

在组织P系统中,每个组织细胞都有若干进化规则,指导对应细胞内的对象进化操作,一个对象OBu通过进化规则进化成OBv的过程通常表示为OBu→OBv;在组织P系统中的三个组织细胞分别采用不同的进化规则,通过混合三种不同的进化机制可以增加对象在系统进化过程中的多样性,为了更好的将进化机制和求解问题结合,根据所设计的组织P系统膜结构和转运机制,设计三种进化算法;

第三步、数据细胞根据运转规则更新全局最优对象

系统中的组织细胞的细胞膜间存在转运通道,不同的对象在不同的组织细胞之间进行共享与交换,都需要系统定义的转运规则支撑;在设计的组织P系统中定义了转运规则来指导组织细胞间交换信息;

第四步、停机与输出

系统中的各个组织细胞作为单独的执行单元以并行的结构进化运行,故该系统是并行分布式的,在该系统中,定义一系列的计算步骤为一个计算,可以从包含初始数据细胞对象集的组织细胞开始,在每一个计算中,都意味着有一个或者多个进化规则被作用于当前的数据细胞对象集上,当达到系统的停机约束条件时,系统自动停机,计算结果呈现于系统的外环境中。

2.如权利要求1所述的面向大数据领域的膜计算数据细胞聚类方法,其特征在于,所述第一步中,形式化定义的过程如下:

1.1、组织P系统定义:

一个度为3的即3个由数据细胞组织P系统形式化定义为以下八元组:

ω=(OB1,OB2,OB3,OR1,OR2,OR3,OR′,OEo)

其中:

OB1、OB2和OB3为各组织细胞的对象集,即数据细胞集合;

OR1、OR2和OR3为各组织细胞的进化规则,分别代表基于Agnes和k-means算法、基于加权FCM算法和基于GA算法的聚类规则;

OR′代表整个P系统中各组织细胞的转运规则,通过转运规则,细胞与细胞之间可以进行对象的共享与交换;

OEo=0为系统的输出区域,代表环境;

1.2、组织对象定义

在数据聚类算法中,组织P系统功能是为需要进行聚类的数据集搜索最优的聚类中心,因此,可以将数据的聚类中心用一组对象来表示,定义P系统中的组织细胞对象T为一个N*d维度向量,如下:

T=(t11,t12,...,t1d,...,ti1,ti2,...,tid,...,tN1,tN2,...,tNd,)

其中N代表该数据细胞T有N个簇,这N个簇C1,C2,...,CN对应的簇中心为t1,t2,...,tN,类似于数据点,对象中的每一个簇中心都是一个d维度向量,则ti可以表示为ti1,ti2,...tid,i=1,2,...,N,tid代表第i个数据簇中心的d个分量;

OBi代表P系统中第i个进化膜中的对象集合,其内包含一组对象,这些对象通过不同组织细胞中的进化机制进行进化反应,定义每个进化膜中的初始对象数量均为m,组成其对象集Q.在P系统的进化过程实施中,系统需要一个度量机制评价当前对象的优劣,通过计算样本整体的簇方差作为聚类问题性能函数Jm,进行对象的优质判定,其中sj代表数据簇中的某个数据集,Jm值越小,说明对象越好,通过对象的判断排序,每个进化膜中都有一个其最优的对象,即局部最优对象OBibest,而系统的环境中保存有一个最优对象,即全局最优对象,记为Tbest,当整个系统达到停机状态的时候,环境中的全局最优对象即为所求的解,也是最优的聚类中心;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910692297.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top