[发明专利]一种基于分层混合模型的信号肽及其切割位点的预测方法有效
申请号: | 201710140273.X | 申请日: | 2017-03-10 |
公开(公告)号: | CN106951735B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 沈红斌;张以泽 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 唐燕洁 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 混合 模型 信号肽 及其 切割 预测 方法 | ||
1.一种基于分层混合模型的信号肽及其切割位点的预测方法,其特征在于,包括如下步骤:
1)首先在第一层应用基于氨基酸残基特征的SVM分类器识别蛋白质序列是否含有N端疏水性片段;
2)若含有N端疏水性片段,则在第二层应用基于氨基酸残基特征和功能性结构域特征对应的朴素贝叶斯和SVM分类器识别N端疏水性片段是信号肽还是N端跨膜螺旋;
3)若识别结果为信号肽,则先根据统计学习规则筛选候选切割位点并计算统计性信任分数,然后再通过Needleman-Wunsch序列比对算法计算候选信号肽序列的相似性分数,对统计性信任分数和序列相似性分数积分确定预测的信号肽切割位点。
2.根据权利要求1所述的基于分层混合模型的信号肽及其切割位点的预测方法,其特征在于,所述步骤1)的具体方法为:
a.利用蛋白质氨基酸序列提取PSSM矩阵信息,二级结构信息,可溶性信息和氨基酸物理化学信息,使用mRMR进行特征提取,生成氨基酸残基特征;
b.从CDD(Conserved Domain Database)数据库中提取蛋白质序列的功能性结构域信息,并根据CDD提供的聚类信息将功能结构信息映射成超家族,并根据超家族出现的频率生成功能性结构域特征。
3.根据权利要求2所述的基于分层混合模型的信号肽及其切割位点的预测方法,其特征在于,所述步骤2)的具体方法为:
c.根据蛋白质序列的两类特征分别训练SVM分类器和朴素贝叶斯分类器用于信号肽预测。
4.根据权利要求3所述的基于分层混合模型的信号肽及其切割位点的预测方法,其特征在于,所述步骤3)的具体方法为:
d.对于预测为信号肽的蛋白质序列,使用不对称滑动窗口[-13,+2]在蛋白质序列上生成氨基酸序列片段;
e.根据信号肽的{-3,-1,+1}规则,在生成的氨基酸序列片段中筛选候选的信号肽切割位点,并计算每个候选切割位点对应的统计性信任分数;
f.由候选的信号肽切割位点生成对应的信号肽候选序列,并将该信号肽候选序列和含有注释信息的信号肽序列应用Needleman-Wunsch算法做序列比对,并计算每条信号肽候选序列对应的序列相似性分数和通过序列比对得到的信号肽切割位点;
g.对于每个候选切割位点对应的统计性信任分数和序列相似性分数进行积分,计算最终预测的信号肽切割位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710140273.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于抛物面灯罩的色选机用照明灯
- 下一篇:一种自动理管机的接管装置