[发明专利]基于改进PSO算法的蛋白质功能模块检测方法有效
申请号: | 201610240098.7 | 申请日: | 2016-04-18 |
公开(公告)号: | CN105930688B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 郑相涵;李坤;于元隆;陈日清 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 pso 算法 蛋白质 功能模块 检测 方法 | ||
技术领域
本发明是基于原始的PSO(Particle swarm optimization)算法,对其进行改进后结合生物基因本体知识应用于生物蛋白质相互作用网络(Protein to Protein Interaction Network,PPIN)中蛋白质功能复合体的识别中来。
背景技术
随着人类基因组计划的完成,蛋白质组学的研究已经成为生命科学乃至自然科学领域中最重要的研究课题之一。因为蛋白质很少以独立个体的方式参与生命过程,而是通过蛋白质复合体的形式完成其生物学功能。因此蛋白质相互作用及相互作用网络的研究和分析很自然地成为理解生命活动中细胞组织、过程和功能的基础。目前,对蛋白质相互网络的研究,主要集中在检测蛋白质复合体和功能模块上,这个问题已转变为在蛋白质相互网络图中识别稠密子图的问题。普遍的做法是将蛋白质网络表示成一个图,其中节点表示蛋白质,边表示蛋白质之间的相互作用。这样,就可以利用各种图聚类算法来挖掘蛋白质复合体和功能模块。
粒子群算法是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法,相对于其他聚类算法具有较大的优势,所以将其应用于蛋白质网络的识别问题上来。
发明内容
本发明的目的是基于原始的PSO(Particle swarm optimization)算法,对其进行改进后结合生物基因本体知识应用于生物蛋白质相互作用网络(Protein to Protein Interaction Network,PPIN)中蛋白质功能复合体的识别中来。
本发明采用以下技术方案实现:一种基于改进PSO算法的蛋白质功能模块检测方法,其特征在于,包括以下步骤:步骤S1:以PPIN的拓扑结构为基础,根据存在相互作用的蛋白质建立邻接矩阵,再根据距离公式(1)计算蛋白质间的距离dij:
其中Int(i)和Int(j)分别代表蛋白质i和j具有邻接蛋白质的数量总和,|Int(i)ΔInt(j)|=|Int(i)∪Int(j)|-|Int(i)∩Int(j)|,以此得出蛋白质网络的距离矩阵;步骤S2:对于每个粒子,随机选取0~n之间的整数k,其中n为蛋白质的个数,求出其余各蛋白质到蛋白质k之间的距离作为当前粒子的初始位置,粒子群中初始群体最优位置是以各蛋白质到中心蛋白质的距离作为粒子群体历史最优位置,粒子的种群规模取蛋白质个数的5倍;步骤S3:将惯性权重w设为可调因子:w=0.9-a*0.4b;将学习因子c2也设为可调因子:c2=2.0*a/b,其中a为当前迭代次数,b为总迭代次数;步骤S4:在PSO算法搜索得出最优解后,引入基于拓扑和功能信息的后处理策略;基本PSO的数学描述:假设粒子群的初始种群大小有N,问题空间的维数为N,粒子的初始速度和位置随机产生,t时刻粒子i的速度为位置为其中i=1,2,..,N,m∈N;将粒子i在搜索过程中达到过的最优位置记为整个粒子群在搜索过程中到达过的最优位置记为则在t+1时刻粒子i在j维空间的飞行速度和位置按如下公式进行更新:
(2)式中w为惯性权重函数值,c1,c2为学习因子,r1,r2为(0,1)之间的随机数,(4)式表示粒子的速度限制在[-vmax,vmax]之间,vmax为粒子最大速度;
粒子群的算法流程描述如下:
Step1:随机初始化粒子群中各个粒子的速度和位置,并且将各个粒子的初始个体最优位置设为粒子的初始位置,将所有个体最优位置中的最优位置设为初始粒子群的群体最优位置;
Step2:对各个粒子的评估函数值进行计算;
Step3:如果评估函数值优于其原先评估函数值,则把当前位置更新为粒子的个体最优位置;如果评估函数值优于群体评估函数值,则把当前位置更新为群体历史最优位置;
Step4:更新各个粒子的速度和位置,更新公式为(2)~(4);
Step5:判断是否达到最大迭代次数,如果达到,则输出最优解,结束算法,否则返回step2。
进一步的,步骤S4包括以下具体步骤:主要分为两个部分基于功能信息的模块规划和基于拓扑的模块规划:步骤S41:基于功能的模块规划:合并功能相似的初始蛋白质功能模块,使用公式(5)衡量2个模块的相似性:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610240098.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于基因组的警报系统
- 下一篇:损伤等级模型验证方法及系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用