[发明专利]蛋白质复合物深度多序列比对方法有效
申请号: | 201911290749.3 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111145833B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 於东军;刘子;朱一亨 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/00;G16B40/00;G16B50/00 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 复合物 深度 序列 方法 | ||
1.一种蛋白质复合物深度多序列比对方法,其特征在于,包括以下步骤:
步骤1、蛋白质单体序列数据库与基因组距离搜索算法的构建:
首先,从蛋白质单体序列全基因组数据中下载Uniclust30蛋白质单体序列数据库;
其次,使用多序列比对软件HHblits软件分别对蛋白质单体序列搜索蛋白质序列数据库Uniclust30进行多序列比对,得到蛋白质单体序列的多序列比对信息;
再次,分别将蛋白质单体序列的多序列比对结果与基因组数据库ENA进行比对;
最后,根据两个不同的单体序列的多序列比对与基因组数据库种的比对的距离将不同的两种不同单体序列的多序列比对进行连接,从而得到蛋白质复合物基于基因组距离的多序列比对;
步骤2、蛋白质单体序列数据库与物种相似性搜索算法的构建:
首先,从公共数据库美国国立信息中心NCBI中下载物种分类数据库Taxonomy;
其次,使用多序列比对软件HHblits软件分别对蛋白质单体序列搜索步骤1构建的蛋白质序列数据库Uniclust30进行多序列比对,得到蛋白质单体序列的多序列比对信息;
再次,分别将蛋白质单体序列的多序列比对结果与物种分类数据库Taxonomy进行物种比对;
最后,根据物种比对结果将两个不同的单体多序列比对进行连接,从而得到蛋白质复合物基于物种的多序列比对结果;
步骤3、蛋白质交互网络数据库与蛋白质相互作用搜索算法构建:
首先,从公共数据库蛋白质相互作用网络数据库STRING中下载蛋白质相互作用信息STRING linker以及蛋白质相互作用的序列信息数据库STRING database;
其次,使用多序列比对软件HHblits软件分别对蛋白质单体序列搜索上述步骤构建的蛋白质相互作用序列信息数据库进行多序列比对,得到蛋白质单体序列的多序列比对信息;最后,根据蛋白质相互作用信息将两种不同蛋白质单体序列的多序列比对进行连接,从而得到基于蛋白质相互作用网络的蛋白质复合物序列的多序列比对结果;
步骤4、蛋白质复合物多序列比对方法选择:
首先,使用计算步骤1中基于基因组距离的蛋白质复合物多序列比对中有效序列的条数;
其次,如果步骤1中的多序列比对中的序列条数满足要求,则将步骤1的对序列比对作为去除冗余序列步骤的输入,反之则将步骤1中的多序列比对与步骤2中基于物种类别的多序列比对进行合并并且计算有效序列的条数;
再次,如果步骤1与步骤2的合并后的有效序列条数满足条件,则将合并结果作为除冗余序列步骤的输入,否则,将步骤1与步骤2以及步骤3中基于蛋白质相互作用网络的多序列比对合并,作为去除冗余序列步骤的输入;
步骤5、去除多序列比对冗余:将步骤4中产生的蛋白质复合物多序列比对进行去除冗余,使得去除冗余后的多序列比对中任意两条序列的相似性小于90%。
2.根据权利要求1所述的多序列比对方法,其特征在于:所述步骤1中,
(1)从蛋白质单体序列全基因组数据中下载Uniclust30蛋白质单体序列数据库;
(2)分别对序列A和序列B使用多序列比对软件HHblits软件搜索蛋白质序列数据库Uniclust30进行多序列比对,分别得序列A和序列B的多序列比对信息MSA_A和MSA_B;
(3)将多序列比对结果MSA_A和MSA_B与基因组数据库进行比对,分别得到多序列比对结果的基因信息MSA_A_gene和MSA_B_gene;
(4)计算MSA_A_gene与MSA_B_gene中具有相同基因的两个蛋白质i和j的基因距离Δgene,如果1≤Δgene≤20,则将蛋白质i与蛋白质j连接起来;
(5)根据(1)~(4)的步骤,构建基于基因距离的蛋白质复合物多序列比对MSA。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911290749.3/1.html,转载请声明来源钻瓜专利网。