[发明专利]一种基于片段库信息增强的蛋白质结构预测方法有效
申请号: | 201910018660.5 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109658979B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;刘俊;彭春祥;胡俊;周晓根;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 片段 信息 增强 蛋白质 结构 预测 方法 | ||
一种基于片段库信息增强的蛋白质结构预测方法,首先,根据片段库中片段的二级结构与预测的蛋白质二级结构的匹配度建立二级结构评分模型,然后根据过滤因子控制筛选力度,将二级结构匹配得分较差的片段从片段库中删除,再利用片段组装技术对片段库中的片段进行组合优化生成预测蛋白质结构,从而提高蛋白质结构预测的效率和精度。本发明提供一种预测精度较高的基于片段库信息增强的蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于片段库信息增强的蛋白质结构预测方法。
背景技术
随着2003年人类基因组计划正式宣布完成,人类已经破解第一遗传密码,即DNA以三个核苷酸为一组的密码子转译为蛋白质氨基酸序列的过程。然而,蛋白质如何从氨基酸序列折叠成特定的三维结构任是未解之谜。蛋白质的三维结构决定了其特定的生物功能,因此如何高效的获取蛋白质三维结构成为生物信息学领域的重要研究课题。
获取蛋白质三维结构的途径主要有两种。第一种途径是利用实验方法直接测定蛋白质的三维结构,这类方法包括X射线晶体衍射、核磁共振、冷冻电镜技术等,这类方法所需的资金投入高、测定周期长,并且不能适用于所有类型的蛋白质。第二种途径是利用生物大数据、人工智能和系统优化技术直接从蛋白质氨基酸序列预测其三维结构,这类方法以计算机为基础,所需的成本较低,能够高效的预测蛋白质三维结构。全世界范围内有许多研究机构正在研究第二类方法,并逐渐应用于疾病诊断和药物设计,其中具有代表性的研究团队有美国华盛顿的David Baker实验室、美国密歇根大学的张阳实验室等。国内越来越多的高校和研究机构也加入到蛋白质结构预测的研究当中。
目前,大多数蛋白质结构预测方法都用到了片段组装技术。首先,利用深度学习的方法根据预测蛋白质的氨基酸序列从蛋白质数据库中提取结构片段组成片段库;然后,在能量函数的引导下利用片段组装技术对片段库中的片段进行组合优化生成预测蛋白质结构。然而,片段库中的信息不都是有效的,甚至存在一些错误信息,这些错误信息的存在不仅增加了计算代价而且会对预测蛋白质的精度产生不利影响。
因此,目前蛋白质结构预测方法使用的片段库包含一些不利信息,造成蛋白质结构预测的效率和精度较低,需要进行改进。
发明内容
为了减小片段库中不利信息降低预测蛋白质的精度,本发明提供一种预测精度较高的基于片段库信息增强的蛋白质结构预测方法。首先,根据片段库中片段的二级结构与预测的蛋白质二级结构的匹配度建立二级结构评分模型,然后根据过滤因子控制筛选力度,将二级结构匹配得分较差的片段从片段库中删除,再利用片段组装技术对片段库中的片段进行组合优化生成预测蛋白质结构,从而提高蛋白质结构预测的效率和精度。
本发明解决其技术问题所采用的技术方案是:
一种基于片段库信息增强的蛋白质结构预测方法,包括以下步骤:
1)输入预测蛋白质的序列信息和预测的二级结构信息;
2)设置参数:片段长度为3的片段库过滤因子filter3,片段长度为9的片段库过滤因子filter9,片段组装次数M,玻尔兹曼温度因子KT;
3)筛选片段库信息,过程如下:
3.1)设r=1,r∈{1,2,…,L-f+1};其中r表示滑动窗口编号,L为蛋白质序列长度,f∈{3,9}为滑动窗口的宽度;
3.2)计算滑动窗口的二级结构最高分,过程如下:
3.2.1)设第n号残基预测的二级结构为α-helical、β-strand和loop的置信度分别为和其中n∈{r,r+1,…,r+f-1};
3.2.2)第r个滑动窗口的二级结构总分为:
3.3)对滑动窗口对应的片段库进行筛选,过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910018660.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置