[发明专利]含二硫键多肽的结构预测方法及装置有效
申请号: | 202010606233.1 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111653310B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 刘紫琳;胡景皓;蒋帆;吴云东 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B30/10;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 周建军;彭家恩 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二硫键 多肽 结构 预测 方法 装置 | ||
1.一种含二硫键多肽的结构预测方法,其特征在于,包括:
序列比对步骤,包括将待预测结构的目标多肽与含二硫键蛋白质的模板库中所有序列进行半胱氨酸特异性序列比对,提取序列特征;
候选模型构建步骤,包括将所述序列特征输入机器学习模型中,筛选得到候选模板,根据所述候选模板构建三维模型,得到候选模型;
结构特征提取步骤,包括从所述候选模型中提取结构特征;
结构预测步骤,包括将所述序列特征、结构特征输入机器学习模型中,输出模型,得到预测结构;
所述序列特征包括原始特征、衍生特征中的至少一个;
所述原始特征包括胱氨酸相关原始特征、序列比对原始特征中的至少一个;
所述胱氨酸相关原始特征包括如下特征中的至少一个:
A1)目标多肽序列中二硫键半胱氨酸的数量;
A2)模板序列中二硫键半胱氨酸的数量;
A3)目标多肽序列二硫键半胱氨酸与模板序列二硫键半胱氨酸的数量差;
A4)序列比对中,目标多肽序列二硫键半胱氨酸与模板序列二硫键半胱氨酸匹配的数量;
A5)序列比对中,相邻的匹配二硫键半胱氨酸之间的环区长度一致的数量;
A6)序列比对中,目标多肽序列二硫键半胱氨酸与模板序列二硫键半胱氨酸“成对”匹配的数量;
A7)序列比对中,相邻的“成对”匹配二硫键半胱氨酸之间的环区长度一致的数量;
和/或,所述序列比对原始特征包括如下特征中的至少一个:
B1)序列比对分数;
B2)非空位匹配的残基数;
B3)序列一致性;
B4)序列比对长度;
B5)目标多肽序列长度;
B6)模板序列长度;
B7)目标多肽序列插入的空位数量;
B8)模板序列插入的空位数量;
B9)序列比对中总空位数量;
B10)目标多肽序列首端插入的空位数量;
B11)目标多肽序列末端插入的空位数量;
B12)目标多肽序列中间插入的空位数量;
B13)模板序列首端插入的空位数量;
B14)模板序列末端插入的空位数量;
B15)模板序列中间插入的空位数量;
B16)除去首端和末端空位的目标多肽序列长度;
B17)除去首端和末端空位的模板序列长度。
2.如权利要求1所述的结构预测方法,其特征在于,所述模板库中的单链结构含有至少1对链内二硫键。
3.如权利要求1所述的结构预测方法,其特征在于,所述模板库中的单链结构含有至少2对链内二硫键。
4.如权利要求1所述的结构预测方法,其特征在于,在目标多肽的序列比对中,二硫键半胱氨酸与游离态半胱氨酸区分对待,而且替换矩阵中二硫键半胱氨酸对的分数高于游离态半胱氨酸对。
5.如权利要求1所述的结构预测方法,其特征在于,所述序列比对的方法采用Smith-Waterman算法、Needleman-Wunch算法中的任一种。
6.如权利要求1所述的结构预测方法,其特征在于,所述序列比对的方法采用Smith-Waterman算法。
7.如权利要求1所述的结构预测方法,其特征在于,序列比对时,分数设置规则为:替换分数>空位开放罚分>空位延伸罚分。
8.如权利要求1所述的结构预测方法,其特征在于,序列比对时,设置二硫键半胱氨酸对替换分数为33、空位开放罚分为-10、空位延伸罚分为-0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010606233.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:触控基板及触控显示装置
- 下一篇:一种整车环境试验舱用节能系统及控制方法