[发明专利]一种全局比对的蛋白互作网络融合方法在审
申请号: | 201610012802.3 | 申请日: | 2016-01-11 |
公开(公告)号: | CN105678108A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 郝彤;彭玮;孙金生 | 申请(专利权)人: | 天津师范大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 天津市杰盈专利代理有限公司 12207 | 代理人: | 朱红星 |
地址: | 300387 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全局 蛋白 网络 融合 方法 | ||
技术领域
本发明属于生物信息学技术领域,涉及一种全局比对的蛋白互作网络融合方法。
背景技术
蛋白质是生命的物质承担者,在形成几乎所有生命系统、调控各种生理/病理进程 中发挥重要的作用。但是生命体性状的改变不能仅仅归结为单独几个蛋白质的作用,而是 许多蛋白之间的相互作用。因此,蛋白质互作网络的研究已经成为蛋白质研究的热点。蛋白 相互作用网络可以通过一些高通量的实验方法得到,如酵母双杂交[1]、免疫沉淀串联质谱 分析[2]等。然而实验方法的复杂性使得并不是所有物种都已经具有通过实验得到的蛋白 互作数据,当不具备实验数据的条件下,基于整合各种数据库数据的计算机构建方法也在 兴起,如通过融合酵母、果蝇、线虫和人的同源蛋白而构建的拟南芥蛋白互作网络[3]。这种 构建方法在构建质量和全面性上尚不完善,这一问题直接影响了对凡纳滨对虾免疫机理的 研究和分析,而本专利中提出的全局比对的蛋白互作网络算法通过同源序列比对,最大程 度融合不同的蛋白互作网络信息,在构建质量和数据全面性上都得到了提高。
具备两个不同的蛋白互作网络及每个节点的序列数据,blast软件,以及perl软 件。
该方法将两个不同物种的蛋白互作网络进行融合,以此构建新的蛋白互作网络。
发明内容
一种全局比对的蛋白互作网络融合方法,其特征在于它分为序列比对,节点提取 和网络融合三个步骤;
将需要融合的两个网络中,其中一个作为目标网络,另一个作为质询网络。网络融合时 先建立两网络中节点的关系,即两个网络中的序列同源关系。然后以一对相互作用关系为 单位,从目标网络中提取出重合的互作关系或者添加目标网络中不存在的互作关系,最后 形成融合的蛋白互作网络。网络融合的过程如图1所示。网络融合的步骤为:
(1)序列比对:比对目标网络和质询网络中的节点序列,以目标网络中的序列数据作为 数据库,比对时期望值(E值)为1e-005。
(2)节点提取:分析比对结果,认为质询网络中的序列与目标网络中满足E值为1e- 005的条件,且第一个匹配的序列(即相似度最高的序列)是同源的,提取目标网络和质询网 络中所有具有同源关系的序列及其在目标网络和质询网络中的互作关系。
(3)网络融合:将质询网络中的互作数据和目标网络的互作数据进行融合。以一个 相互作用关系为单位进行比对,融合过程分为以下三种情况:
(a)一个相互作用的两个节点序列都被认定为同源关系时,直接提取目标网络互作数 据,融合网络中对应节点的序列名称采用目标网络中的序列名称,如图1中的C-D;
(b)只有一个节点序列被认定为同源关系时,融合网络中对应节点的序列名称采用目 标网络中的序列名称,并同时添加与之相互作用的目标网络和质询网络中的序列,如图1中 的D-E和D-f;
(c)若两个节点没有被认定为同源关系时,则在融合网络中添加质询网络中的序列及 其相互作用,如图1中的f-g。
本发明公开的全局比对的蛋白互作网络融合方法的有益效果在于:
该方法应用在构建凡纳滨对虾全局蛋白网络中。实验采用凡纳滨对虾血淋巴组织样 品,测序后获得凡纳滨对虾转录组数据共有52073条unigene。所选择的模式生物为果蝇、线 虫、人、褐鼠、家鼠和酵母,首先将模式生物蛋白序列分别与凡纳滨对虾血淋巴组织unigene 序列进行比对,得到了六个基于上述六种模式生物的蛋白互作子网络,之后将这六个子网 络按照与凡纳滨对虾亲缘关系由近及远的顺序依次进行网络融合,融合顺序为果蝇、线虫、 人、褐鼠、家鼠、酵母,经过五次融合,最终得到凡纳滨对虾的蛋白互作网络。
网络融合过程采用本专利所述方法。按照本专利所述方法,以果蝇蛋白互作网络 和线虫蛋白互作网络的融合为例,网络融合过程及结果如下:
(1)果蝇蛋白网络作为目标网络,线虫蛋白互作网络作为质询网络。将果蝇蛋白序列与 线虫蛋白序列进行比对,比对方法采用blastp,认为第一个匹配的序列为同源序列。
(2)提取果蝇蛋白互做网络和线虫蛋白互作网络中所有具有同源关系的序列及其 互作关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学,未经天津师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610012802.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用