[发明专利]一种基于灰色BP神经网络蛋白互作关系预测方法在审
申请号: | 201810057280.8 | 申请日: | 2018-01-22 |
公开(公告)号: | CN108427867A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 王雪;王儒敬;桂元苗;魏圆圆;李伟;贾秀芳;张俊卿 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G06F19/24 | 分类号: | G06F19/24;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 23000*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 灰色系统 神经网络 蛋白 预测 输入测试数据 蛋白质序列 水稻蛋白质 灰色问题 序列特征 学习过程 计算量 求解 建模 可控 蛋白质 判定 样本 融合 引入 改进 | ||
本发明公开了一种基于灰色BP神经网络蛋白互作关系预测方法,包括以下步骤:步骤一、水稻蛋白质序列特征提取;步骤二、OGN建模;步骤三、输入测试数据,判定蛋白质序列中蛋白与蛋白之间的相互作用关系。本发明采用灰色BP神经网络算法对蛋白质互作关系进行预测,并针对BP神经网络存在的缺陷,引入灰色系统对神经网络的学习过程进行改进,将对灰色系统和神经网络进行融合,建立一种兼具两者优点的方法,则利用这种方法求解灰色问题时,与神经网络方法相比;计算量小,在少样本情况下也可达到较高精度;与灰色系统方法相比,计算精度高,且误差可控。
技术领域
本发明涉及生物信息领域,特别涉及一种基于灰色BP神经网络蛋白互作关系预测方法。
背景技术
蛋白质相互作用(PPI,protein-protein interaction)是后基因组时代生物学研究的热点及难点。蛋白质相互作用是生物体中众多生命活动过程的重要组成部分,在许多细胞生物学过程中起着重要的作用。细胞进行生命活动过程的实质就是蛋白质在一定时空下的相互作用。新陈代谢、信号转导、细胞周期调控、新陈代谢、细胞凋亡及免疫应答等一系列生命活动都是通过蛋白质相互作用实现的。因此,开发更准确的方法来识别PPI以更好地理解蛋白质功能,研究蛋白质互作网络具有必要性和紧迫性。
近几年发展起了诸多高通量实验方法,例如:酵母双杂交方法、蛋白质芯片方法、质谱蛋白质复合物鉴别以及质谱分析等。然而,这些方法都是通过化学实验的方法,需要耗费大量的人力、财力和时间。伴随着高通量的实验手段的出现,生物学数据不仅在量上急速增长在质上进一步向相互关系信息发展。海量的生物学数据为我们发展计算学方法来研究蛋白质间相互作用以及蛋白质构象和功能提供了可能,这些数据中隐藏着许多未知的生物学功能。因此,如何利用这些数据序列知识挖掘出有效的信息是探索生命过程中需要解决的重要问题。
机器学习方法是传统计算方法的进一步发展,如支持向量机、遗传算法、神经网络和隐马尔可夫模型等,其基本概念是通过模式匹配、样本学习或逻辑推理以及现有样本数据进行独立学习和自我完善的过程。机器学习方法在蛋白质预测中得到了广泛的应用,如杨磊等提出了一个基于神经网络的方法预测蛋白质中的β-发夹结构。
人工神经网络(ArticfialiNuear1Netwoksr)是由若干元(也称神经元)按照不同方式相互连接而构成的非线性动力系统,由人脑神经元网络抽象而来,从信息分析和处理的角度,对自然神经网络的特性进行抽象和模拟,按不同的规则和连接方式组成网络,具有高度的并行性和高速的信息处理能力。
P(Back Propagatinn)算法,即误差反向传播算法,无监督学习是一种自组织学习过程,不需要外界提供学习样本。这种学习仅仅是根据网络的输入值来调整网络的权值和阈值,在学习的过程中,网络只须响应输入信号的激励,按照某种规则反复调节网络权值和阈值,直到最后形成某种有序的状态。
BP神经网络算法是目前应用最广泛的神经网络模型之一,被成功应用于信息、生物和医学等领域的研究中。BP神经网络算法的引入,使蛋白质结构预测获得了新的途径。
灰色系统(GreySystem)是指信息不完全、不确定的系统,灰色问题(GreyProblem)是指结构、特征、参数等信息不完备的问题。目前比较常用的灰色预测模型为GM(n,h)模型群,其中G表示grey(灰色),m表示model(模型),n表示模型的阶数,h代表模型变量的个数。主要包括GM(U)、GM(1,N)、GM(2,1),Verhulst模型、离散灰色模型等,它更多地适用于初始数据序列变化趋势呈单调变化的情况。而神经网络具有并行计算,分布式信息存储,容错能力强,自适应学习功能等优点,在处理复杂的人工智能问题上显示出极优越的地位。通过对灰色系统和神经网络的研究,研究发现灰色系统和神经网络可以融合,两种方法各有所长。比单一用一种方法计算精度高,且误差可控。为此,我们提出一种基于灰色BP神经网络蛋白互作关系预测方法。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810057280.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用