[发明专利]一种基于进化算法和模糊聚类的蛋白质功能模块识别方法在审
申请号: | 202111552679.1 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114239726A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 田野;胡佳星;司朗春;张兴义 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00;G06F17/16 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 进化 算法 模糊 蛋白质 功能模块 识别 方法 | ||
本发明公开了一种基于进化算法和模糊聚类的蛋白质功能模块识别方法,其步骤包括:步骤一、基于蛋白质网络的属性初始化种群,使用进化算法优化两目标问题,寻找非重叠的蛋白质模块的最优核心蛋白质节点,从而完成非重叠的蛋白质功能模块识别;步骤二、基于步骤一得到的核心蛋白质节点,初始化子种群,并用进化算法优化新的两目标问题,确定非核心蛋白质节点的最优模糊阈值,从而完成重叠的蛋白质功能模块识别。本发明能在不预定任何参数的情况下,自适应处理不同类型的蛋白质网络结构,从而提高蛋白质功能模块识别过程的稳定性,并且在蛋白质网络中找到较多有效的蛋白质功能模块的最优划分结果。
技术领域
本发明涉及复杂蛋白质网络功能模块识别技术领域,具体地说是一种基于进化算法和模糊聚类的蛋白质功能模块识别方法,通过进化算法优化得到最优核心蛋白质节点及其最优模糊阈值,从而识别出非重叠的蛋白质模块划分和重叠的蛋白质模块划分。
背景技术
研究生物系统中的蛋白质网络的功能模块识别,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白质之间的功能联系都有重要意义。而蛋白质功能模块的识别已经发展成为一种重要的科学技术,科学家们已经提出很多方法来发现蛋白质网络中的非重叠的蛋白质功能模块,但在实际蛋白质网络模块划分中,蛋白质功能模块之间存在着大量重叠的现象,即存在一个蛋白质节点属于多个蛋白质功能模块的情况。因此,如何快速有效地识别蛋白质网络的功能模块成为一个研究热点,蛋白质功能模块的研究已成为进一步了解生命活动的机制和组织的重要方法。
目前蛋白质网络功能模块识别领域中的问题主要包含两类研究方法:一是生物学的传统检测方法,使用生物数据库总蛋白质注释数据的功能模块定义方法,但该法依赖实际可靠的生物实验技术以及高质量的生物数据库,实施成本高;二是基于蛋白质网络的拓扑结构,通过人工智能思想设计方法识别蛋白质功能模块,得到紧密联系的蛋白质区域通常会与之相对应的功能模块,但对技术性要求高。
随着高通量实验技术的不断发展,蛋白质网络的规模和复杂性呈爆炸式增长,受传统方法的限制,所识别的蛋白质功能模块结构往往不稳定,且不能满足用户对多样结构的要求。因此,需要一种准确度高、鲁棒性强的算法来获取蛋白质网络中的蛋白质功能模块。聚类算法用于分析蛋白质相互作用网络中所包含的信息,是探索蛋白质功能模块特征的有效途径。而模糊聚类是一种允许一个蛋白质节点属于多个类的聚类方式,这与重叠的蛋白质功能模块的情况十分契合。但是,模糊聚类非常依赖蛋白质功能模块的核心蛋白质节点的准确识别,否则算法容易陷入局部最优。另外,模糊聚类方法涉及多个参数的设置,需要用户提前设置合适的参数值,从而难以适应实际场景情况。
发明内容
本发明为克服现有技术中存在的不足之处,提出一种基于进化算法和模糊聚类的蛋白质功能模块识别方法,以期能在不预设任何参数的情况下,自适应处理不同重叠程度的蛋白质网络,从而提高蛋白质功能模块识别过程的稳定性,以及多种重叠的蛋白质模块划分和非重叠的蛋白质模块划分的准确性。
本发明为解决上述技术问题采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111552679.1/2.html,转载请声明来源钻瓜专利网。