[发明专利]蛋白质信号转导子网的预测方法和装置有效
申请号: | 201410102941.6 | 申请日: | 2014-03-19 |
公开(公告)号: | CN103870720B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 刘伟;谢红卫 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F19/12 | 分类号: | G06F19/12 |
代理公司: | 长沙智嵘专利代理事务所43211 | 代理人: | 黄子平 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 信号 转导 子网 预测 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种蛋白质信号转导子网的预测方法和装置。
背景技术
信号转导网络中涉及很多蛋白质及蛋白质之间的相互作用。大部分分析方法都是基于静态的信号转导模型,即假定一对蛋白质能够发生相互作用,那么在这两个节点之间存在一个连接,网络的结构和特性不随着时间和条件的改变而改变。在实际系统中,信号转导网络时刻都在发生改变,也正是这种改变才使得生物体能够对外界刺激快速作出响应,完成各种复杂的生物学功能。因此,对信号转导网络进行动态的分析是揭示生物系统运行规律的关键。
静态网络提供了对于细胞内系统行为的定性描述,而蛋白质或基因表达数据可以提供分子在不同条件/时间/样本状态下的定量信息,因此,将这两种数据源结合起来可用于阐释细胞内系统的动态组织形式。目前,常用的方法是利用不同条件对应的基因表达谱来识别条件特异子网,用于帮助筛选疾病相关的生物标志物以及发现在不同表型之间通路的变化。条件特异的子网构建方法包括单基因差异分析、基因集差异分析以及基于聚类方法的基因共表达分析等。也有少数方法同时考虑单个基因的差异表达和基因对之间的变化相关性。
现有技术中一种基于基因表达数据发现条件特异的蛋白质相互作用子网的方法,详细步骤如下:
1)从蛋白质相互作用数据库HPRD中下载人的蛋白质相互作用数据集,构建静态蛋白质相互作用网络;
2)同时考虑网络中节点和边随条件的变化,定义综合打分函数;
3)建立全局优化算法COSINE,利用遗传算法提取条件特异的子网;
4)基于两个仿真数据集和三个真实的芯片数据集,发现目标疾病相关的特异子网;
5)将该方法筛选到的特异子网与其他方法得到的子网进行比较,评估预测方法的性能。
上述方式主要是基于基因表达信息,来预测条件特异的蛋白质相互作用子网,由于基因表达数据存在一定噪声,且与实验条件密切相关,使得该方法的预测精度不高,并且算法复杂性较大,运行速度较慢。
针对相关技术中蛋白质信号转导子网的预测精度低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种蛋白质信号转导子网的预测方法和装置,以解决现有技术中蛋白质信号转导子网的预测精度低的问题。
根据本发明的一个方面,提供了一种蛋白质信号转导子网的预测方法。
根据本发明的蛋白质信号转导子网的预测方法包括:建立步骤:建立信号转导网络,其中,一种蛋白质为信号转导网络的一个节点,具有通信关系的两种蛋白质之间的通道为信号转导网络的一条边;第一计算步骤:计算信号转导网络中每个节点和每条边的分值;第一获取步骤:获取信号转导网络中的目标节点及多个第一目标信号子网,其中,目标节点为信号转导网络中节点分值最高的节点,第一目标信号子网为信号转导网络中与目标节点连通的信号子网;第二计算步骤:计算每个第一目标信号子网的子网分值和显著性概率值;第二获取步骤:获取第一目标信号子网中的多个第二目标信号子网,其中,第二目标信号子网为显著性概率值小于预设值的第一目标信号子网;以及确定步骤:确定多个第二目标信号子网中子网分值最高的第二目标信号子网为信号转导子网。
进一步地,采用以下方式计算每个节点的分值:获取节点i对应的蛋白质的实际丰度比和预设丰度比,其中,节点i为信号转导网络中的任一节点;以及根据节点i对应的实际丰度比和目标节点对应预设丰度比,计算节点i的分值。
进一步地,根据实际丰度比和预设丰度比,计算节点i的分值包括:按照以下公式计算节点i的分值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410102941.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种棉花壳剥离器
- 下一篇:MC1R基因突变检测特异性引物和液相芯片
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用