[发明专利]一种基于信息熵的蛋白质结构从头预测方法有效
申请号: | 201710757209.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107491664B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 张贵军;王柳静;周晓根;谢腾宇;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 蛋白质 结构 从头 预测 方法 | ||
一种基于信息熵的蛋白质结构从头预测方法,包括以下步骤:1)给定输入序列信息以及蛋白质力场模型;2)初始化;3)计算距离矩阵;4)k‑mediods聚类;5)构建Markov模型并计算转移矩阵;6)计算信息熵;7)选择操作;8)判断是否满足终止条件,如果满足则终止,并输出全局最优解。本发明提出一种以信息熵为评价指标的蛋白质结构从头预测方法,该方法建立信息熵指标用以度量构象搜索的有序化程度,并且将信息熵指标引入构象选择中,提高从头预测方法的搜索效率以及预测精度。
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于信息熵的蛋白质结构从头预测方法。
背景技术
1990年,美国正式启动了人类基因组计划,并于2003年正式宣布完成,人类基因组计划的顺利实施,标志人类基因组DNA的30亿个碱基对序列测序工作已基本完成。基因组数据测序的巨大进步,对生命科学基础理论的发展有重要意义,但解决实际的医学、药学和材料学等问题,必须获取生物大分子的结构信息进行功能注解,如蛋白质只有折叠成特定的三维结构(即蛋白质三级结构)才能产生其特定的生物学功能,从而进行药物筛选或设计中用于药物分子的构型搜索及蛋白质复合结构的优化。
目前蛋白质数据库PDB中的蛋白质三维结构主要通过结构实验测定技术得到,不仅存在应用局限,测定过程也费时费钱费力,比如,使用NMR方法测定一个蛋白质通常需要15万美元以及半年的时间,因此实验测定蛋白质三维结构的速度远远达不到所需速度。现有条件下,能通过实验测定方法确定的蛋白质结构只是少数,考虑到高性能计算技术的飞速发展,以计算机为工具,运用适当的算法,从序列出发直接预测生物大分子的三维结构,在后基因组时代生命科学的理论和应用研究中将发挥日益重要的作用。
其中,从头预测方法被广泛应用于各种蛋白质的结构预测,该方法不依赖于任何已知结构,而是以Anfinsen热力学假说构建蛋白质能量函数,再通过有效的构象搜索方法来搜寻目标蛋白的天然结构。Anfinsen热力学假说认为蛋白质的天然结构具有热稳定性,对应于蛋白质及周围溶剂分子所构成的整个体系的自由能极小点,因此从头预测方法通常采用片段组装技术,在构象搜索过程中指导算法向低能量构象进行搜索。但是,现有从头预测方法由于不精确的能量函数、低质量的片段库、以及无效的搜索方法等问题,导致其在计算代价和搜索效率方面存在不足,而均方根偏差RMSD值和能量函数值,这两种常用指标无法有效反映从头预测方法所存在的问题,从而限制了该方法的改进和进一步的发展。
因此,现有的从头预测方法在评价指标方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构从头预测方法在评价指标方面的不足,本发明提出一种以信息熵为评价指标的蛋白质结构从头预测方法,该方法建立信息熵指标用以度量构象搜索的有序化程度,并且将信息熵指标引入构象选择中,提高从头预测方法的搜索效率以及预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于信息熵的蛋白质结构从头预测方法,所述方法包括以下步骤:
1)给定输入序列信息,以及蛋白质力场模型,即能量函数Rosetta Score3;
2)初始化:由输入序列产生一系列轨迹数据,即具有时序性的一系列蛋白质构象,记为C={C1,C2,...,Ci,...,Cn},i∈{1,2,…,n},其中,Ci表示当前从头预测方法搜索轨迹n个构象中具有时序关系的第i个构象,并初始化迭代次数G=0;
3)计算轨迹构象集合C中所有构象两两之间的均方根偏差RMSD值,构建如式(1)所示的RMSD距离矩阵D;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710757209.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种病历管理方法、装置、设备及系统
- 下一篇:一种基于生物信息评估的方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置