[发明专利]一种基于信息熵的蛋白质结构从头预测方法有效
申请号: | 201710757209.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107491664B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 张贵军;王柳静;周晓根;谢腾宇;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于信息熵的蛋白质结构从头预测方法,包括以下步骤:1)给定输入序列信息以及蛋白质力场模型;2)初始化;3)计算距离矩阵;4)k‑mediods聚类;5)构建Markov模型并计算转移矩阵;6)计算信息熵;7)选择操作;8)判断是否满足终止条件,如果满足则终止,并输出全局最优解。本发明提出一种以信息熵为评价指标的蛋白质结构从头预测方法,该方法建立信息熵指标用以度量构象搜索的有序化程度,并且将信息熵指标引入构象选择中,提高从头预测方法的搜索效率以及预测精度。 | ||
搜索关键词: | 一种 基于 信息 蛋白质 结构 从头 预测 方法 | ||
【主权项】:
一种基于信息熵的蛋白质结构从头预测方法,其特征在于:所述预测方法包括以下步骤:1)给定输入序列信息,以及蛋白质力场模型,即能量函数Rosetta Score3;2)初始化:由输入序列产生一系列轨迹数据,即具有时序性的一系列蛋白质构象,记为C={C1,C2,...,Ci,...,Cn},i∈{1,2,…,n},其中,Ci表示当前从头预测方法搜索轨迹n个构象中具有时序关系的第i个构象,并初始化迭代次数G=0;3)计算轨迹构象集合C中所有构象两两之间的均方根偏差RMSD值,构建如式(1)所示的RMSD距离矩阵D;其中,dij为轨迹构象中第i个构象和第j个构象之间的RMSD值,另外,可将距离矩阵D中的行数据视为对应构象的距离信息;4)采用k‑mediods方法对轨迹构象进行聚类,过程如下:4.1)随机选取k个构象作为聚类的中心点M,即选择距离矩阵D中的k行数据作为聚类中心点,记为M={M1,...,Mk|Mk={dk1,...,dkn}};4.2)查询距离矩阵D,确定每个轨迹构象与第i个中心点Mi的RMSD值最小,为轨迹构象添加标签tag_i,表示该轨迹构象聚类至第i类;4.3)查询距离矩阵D,确定轨迹构象中与各构象RMSD值最小的构象,作为第i类中新的中心点Mi;4.4)若新旧中心点一致,则聚类终止,否则,返回4.2);5)对轨迹构象构建Markov模型,过程如下:5.1)依据轨迹构象的时序关系,统计第i类中转移至第j类的轨迹构象数,记为zij;5.2)根据概率计算公式,即统计轨迹构象在k个类之间的转移概率,构建如式(2)所示的转移矩阵T:其中,tij为轨迹构象从第i类转移至第j类的转移概率;6)计算信息熵,过程如下:6.1)如式(3)所示,计算概率pij:pij=tijNtransNtrans=Σi=1kΣj=1ktijΣi=1kΣj=1kpij=1---(3)]]>其中tij为轨迹构象从第i类转移至第j类的转移概率,Ntrans为总的转移概率;6.2)如式(4)所示,计算信息熵E:E=Σi=1kΣj=1k-pijlnpij---(4)]]>7)当前从头预测方法继续生成构象,根据如下操作决定新生成的构象Ctrial是否替换其前一个构象Ctarget,过程如下:7.1)当前信息熵为E(Ctarget),将Ctrial计入轨迹构象集合C中,更新信息熵,记为E(Ctrial);7.2)如果E(Ctrial)>E(Ctarget),则构象Ctarget保持不变,当前从头预测方法进行下一次构象搜索;7.3)如果E(Ctrial)>E(Ctarget),则新构象Ctrial替换前一个构象Ctarget;8)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710757209.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种病历管理方法、装置、设备及系统
- 下一篇:一种基于生物信息评估的方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置