[发明专利]一种用后缀数组加速大规模蛋白质鉴定的方法及其系统有效

专利信息
申请号: 201010546475.2 申请日: 2010-11-15
公开(公告)号: CN102467616A 公开(公告)日: 2012-05-23
发明(设计)人: 周郴;迟浩;王乐珩;李由;吴研洁;付岩;孙瑞祥;贺思敏 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06F19/18 分类号: G06F19/18;G06F17/30
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 祁建国;梁挥
地址: 100080 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 后缀 数组 加速 大规模 蛋白质 鉴定 方法 及其 系统
【权利要求书】:

1.一种用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,包括:

步骤1,根据数据库中的蛋白质序列创建相应的后缀数组,并根据所述后缀数组推断与所述蛋白质序列相应的最长公共前缀;

步骤2,基于最长公共前缀和酶切规则,对所述蛋白质序列进行在线酶切,得到非冗余肽;

步骤3,根据串联质谱、所述非冗余肽进行肽谱匹配鉴定,并利用鉴定到的肽推断对应的蛋白质序列。

2.根据权利要求1所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

所述步骤1中,还包括:

根据酶切的类型确定是否需要对所述最长公共前缀的值进行调整,当酶切的类型为特异性酶切时,则需要对所述最长公共前缀的值进行调整。

3.根据权利要求2所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

所述步骤1中,还包括:

将所述最长公共前缀的值调整为符合特异性酶切规则的后缀间的最长公共前缀的值,并把符合特异性酶切规则的后缀作为特殊后缀。

4.根据权利要求2或3所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

所述步骤1中,当酶切的类型为C端特异性Trypsin酶切时,还包括:

当所述后缀的前一个字符是K或R,或所述后缀为蛋白质序列本身时,所述后缀为特殊后缀,将所述后缀间的最长公共前缀的值调整为特殊后缀间的最长公共前缀的值。

5.根据权利要求3所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

对每一个所述后缀数组的后缀,将所述最长公共前缀的值调整为所述特殊后缀之间最长公共前缀的值。

6.根据权利要求4所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

所述步骤2中,当酶切的类型为N端特异性Trypsin酶切时,还包括:

反转所述蛋白质序列,按照C端特异性酶切的方式产生合法的子串,再反转该子串得到合法的肽。

7.根据权利要求2、3、5或6所述的用后缀数组加速大规模蛋白质鉴定的方法,其特征在于,

所述步骤1中,当酶切的类型为非特异性酶切时,还包括:

对于每一个i∈[0,n),后缀Suffix[i]的部分前缀作为整个输入的字符串的子串,该部分前缀是从长度区间为(LCP[i]+1)到整个后缀Suffix[i]长度的前缀;

其中,n为数据库中的蛋白质序列的长度,i为数据库中蛋白质序列第i个位置,Suffix[i]为蛋白质序列第i个后缀,LCP[i]为Suffix[i]对应的最长公共前缀。

8.一种用后缀数组加速大规模蛋白质鉴定的系统,其特征在于,包括:

最长公共前缀模块,用于根据数据库的蛋白质序列创建相应的后缀数组,并根据所述后缀数组推断与所述蛋白质序列相应的最长公共前缀;

非冗余肽获取模块,连接所述最长公共前缀模块,用于基于所述最长公共前缀和酶切规则,对所述蛋白质序列进行在线酶切,得到非冗余肽;

蛋白质序列推断模块,连接所述非冗余肽获取模块,用于根据串联质谱、所述非冗余肽进行肽谱匹配鉴定,并利用鉴定到的肽推断对应的蛋白质序列。

9.根据权利要求8所述的用后缀数组加速大规模蛋白质鉴定的系统,其特征在于,

所述最长公共前缀模块,还用于根据酶切的类型确定是否需要对所述最长公共前缀的值进行调整,如酶切的类型为特异性酶切时,则需要对所述最长公共前缀的值进行调整,并将所述最长公共前缀的值调整为符合特异性酶切规则的后缀间的最长公共前缀的值,并把符合特异性酶切规则的后缀作为特殊后缀。

10.根据权利要求8或9所述的用后缀数组加速大规模蛋白质鉴定的系统,其特征在于,

所述最长公共前缀模块,包括:

后缀数组创建模块,用于为所述数据库中的蛋白质序列创建所述后缀数组;

LCP推导模块,连接所述后缀数组创建模块,用于根据所述后缀数组推导出所述最长公共前缀。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010546475.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top