[发明专利]基于人工蜂群繁殖机制的PPI网络聚类方法有效
申请号: | 201210232874.0 | 申请日: | 2012-07-06 |
公开(公告)号: | CN102779241A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 雷秀娟;李永明;田建芳;裘国永;吴爽;尤梦丽 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 林兵 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于人工蜂群繁殖机制的PPI网络聚类方法,具体包括如下步骤:将PPI网络转化为无向加权图;参数设置;对PPI网络的每个结点和边预处理;计算所有结点的加权网络综合特征值;初始化蜂后;婚飞过程;幼蜂的局部搜索;蜂后的选优;计算当前适应度并比较,直到输出全局最优聚类结果。该方法不需要预先设定聚类个数,在聚类过程中能够自动得到,避免了人为设定聚类个数的主观性,且时间复杂度降低明显。采用MIPS数据库做实验仿真,结果比较接近标准数据库且在正确率、查全率和运行时间等指标上性能较优。与其他的聚类方法相比,该方法采用基于繁殖机制人工蜂群方法机理,能自动确定聚类个数,实现聚类过程,有效提高了聚类效果和计算效率。 | ||
搜索关键词: | 基于 人工 蜂群 繁殖 机制 ppi 网络 方法 | ||
【主权项】:
一种基于人工蜂群繁殖机制的PPI网络聚类方法,其特征在于,具体包括如下步骤:1)将PPI网络转化为一个无向加权图:将PPI网络转化成一个无向加权图G(V,E),其中,V={vi,i=1,2,…,n}为结点vi的集合,E为边e的集合,结点vi表示蛋白质,边e表示蛋白质之间的相互作用,wij表示结点vi和结点vj之间相互作用的大小,也就是结点vi和结点vj之间边eij的权值,若vi和vj之间没有边则wij=0,i=1,2,…,n,j=1,2,…,n;2)参数设置:令count,maxcount分别表示控制外循环的当前迭代次数和外循环对应的最大迭代次数,maxcount∈[10,1000],并令count=1;iter,maxiter分别表示控制内循环的当前迭代次数和内循环对应的最大迭代次数,maxiter∈[10,200];N和S分别表示蜂后婚飞时的能量和速度,N∈[50,1000],S∈[10,500];fval,gfval分别表示当前适应度和全局最优适应度,令gfval=∞;cluster,gcluster分别表示当前的聚类结果和全局最优聚类结果;visited是结点被访问标记;n表示蛋白质结点个数,T表示蜂后与雄蜂交配成功的计数器;3)对PPI网络的每个结点vi和每个边e进行预处理:所述对结点vi预处理是计算结点vi的加权网络综合特征值com‑valuei;所述对边e预处理是计算改进的边聚集系数CCi,j;4)计算所有结点的加权网络综合特征值com‑valuei的代数平均值Av‑com‑value,将大于Av‑com‑value*W的结点保存,其中W∈[0.5,2];5)初始化蜂后:令iter=1,蜂后代表聚类中心,初始化蜂后就是确定第一个聚类中心,从大于Av‑com‑value*W的结点中随机选取一个结点作为第一个蜂后,并令该蜂后结点的visited=1;6)婚飞过程:给蜂后的能量和速度赋初值,令N=100,S=50,令蜂后与雄蜂交配成功的计数器T=0,将与蜂后结点的改进的边的聚集系数CCi,j大于零的结点作为要与蜂后交配的雄蜂,将所有雄蜂结点按照该雄蜂结点与蜂后结点的改进的边的聚集系数CCi,j降序排列,排序后的雄蜂依次与蜂后交配,每交配成功一次,蜂后的速度S和能量N就以式10和式11衰减一次;通 过式9计算每个雄蜂结点与蜂后结点的交配成功概率P(i),同时生成一个[0,1]之间的随机数rand,若P(i)>rand,则交配成功,将该雄蜂的精子加入蜂后的受精囊中,并将该雄蜂结点的访问标记visited修改为1,计数器T=T+1;交配失败则继续与下一个雄蜂交配,直至蜂后的能量N小于能量阈值Thred∈[0.01,0.99]或者蜂后的受精囊中的精子数量大于M∈[20,200],一次婚飞过程结束;进入幼蜂的局部搜索过程;P(i)=exp[‑Δ(f)/S(t)] 式9其中,P(i)表示雄蜂结点vi和蜂后交配成功的概率;‑Δ(f)表示雄蜂结点vi和蜂后结点加权网络综合特征值com‑valuei的差值;S(t)是蜂后在时刻t的速度S;蜂后的速度S和能量E以式10和式11的方式衰减:S(t+1)=α*S(t) 式10N(t+1)=N(t)‑β*N(t)/M 式11其中,v*N(t)/M是每次转移后能量的消耗量;β∈[0.5,2]为能量衰减因子;E(t)表示当前蜂后的能量,E(t+1)表示与一个雄蜂交配后的蜂后的能量;S(t+1)表示与一个雄蜂交配后的蜂后的速度;M表示受精囊大小,α∈[0,1]为每次速度的衰减因子;7)幼蜂的局部搜索过程:将蜂后受精囊中每个精子结点的邻接点中结点加权网络综合特征值com‑valuei最大的结点保存下来,作为发育优良的幼蜂结点;8)蜂后的选优过程:从发育优良的幼蜂结点中选取结点加权网络综合特征值com‑valuei最大的结点作为新的蜂后结点,从而更新了聚类中心;9)iter=iter+1,如果iter<=maxiter,并返回步骤6),否则,转向步骤10);10)计算当前适应度fval;若当前适应度fval<gfval,则令gcluster=cluster,gfval=fval;否则gcluster和gfval不变;11)count=count+1,如果count<=maxcount,并令所有结点的访问标记visited=0,并返回步骤4),否则,输出全局最优聚类结果gcluster。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210232874.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种无线智能控制开关
- 下一篇:一种具有无线功能的急停开关
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用