[发明专利]一种基于多序列联配信息的蛋白质二硫键预测方法有效
申请号: | 201910311799.9 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110176272B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 胡俊;饶亮;刘俊;周晓根;陈伟锋;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于多序列联配信息的蛋白质二硫键预测方法,首先,根据输入的待进行二硫键预测的蛋白质序列信息,使用PSI‑BLAST与HHblits程序分别获取蛋白质的两个不同的多序列联配信息;然后,将两个多序列联配信息进行融合;其次,从融合后的多序列联配信息中抽取输入蛋白质中每个半胱氨酸残基的特征信息;再次,计算两两半胱氨酸残基的特征信息之间的相似度;最后,根据计算得到的每对半胱氨酸残基的相似度,预测该对半胱氨酸残基是否为能形成二硫键的两个半胱氨酸残基。本发明提供一种计算代价低、预测精度高的基于多序列联配信息的蛋白质二硫键预测方法。 | ||
搜索关键词: | 一种 基于 序列 信息 蛋白质 二硫键 预测 方法 | ||
【主权项】:
1.一种基于多序列联配信息的蛋白质二硫键预测方法,其特征在于,所述预测方法包括以下步骤:1)输入待进行二硫键预测的蛋白质序列信息,记作S;2)对蛋白质S,分别使用PSI‑BLAST与HHblits程序搜索蛋白质序列数据库UniRef90,生成两个不同的多序列联配信息,记作
与
3)将两个多序列联配信息
与
进行融合,融合后的多序列联配信息,记作MSAS;4)对蛋白质S中的每个残基Ri,i=1,2,…,L,从MSAS中选取与Ri对应的第i列残基比对信息,并统计20种常见氨基酸在该列比对信息中出现的频率,作为Ri的特征,记作
其中L为蛋白质序列S中的残基数目,
为类型AAj的氨基酸在MSA中第i列出现的频率;5)对于出现在蛋白质S中第Cj个位置的半胱氨酸残基
且W<Cj≤L‑W,选择一个以
为中心的大小为2W+1的窗口,将窗口内残基对应的特征
组合成一个窗口特征,记作
其中K为蛋白质序列S中的半胱氨酸残基数目;6)对蛋白质S中任意一对半胱氨酸残基
与
根据它们的窗口特征
与
计算它们之间有二硫键相互作用的概率![]()
其中
表示窗口特征中第m个元素的值,当
大于阈值T,则将该对半胱氨酸残基预测为能形成二硫键的两个半胱氨酸残基,否则预测为不能形成二硫键的两个半胱氨酸残基;7)返回蛋白质S中被预测为能形成二硫键的所有半胱氨酸残基对信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910311799.9/,转载请声明来源钻瓜专利网。
- 上一篇:多组学数据扰动云
- 下一篇:遗传变异的非侵入性评估的方法和过程
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置