[发明专利]一种alpha跨膜蛋白二级与拓扑结构预测方法及系统在审
申请号: | 202110332960.8 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113012752A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 林关宁;刘喆;王晗 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 卫素丹;胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 alpha 膜蛋白 二级 拓扑 结构 预测 方法 系统 | ||
本发明涉及计算机技术领域,提供了一种alpha跨膜蛋白二级与拓扑结构预测方法及系统,方法包括:构建深度学习模型:从跨膜蛋白数据库中获取大量的a l pha跨膜蛋白序列作为搭建深度学习模型的数据集,并制作二级结构标签和拓扑结构标签;采用独热编码和HHb l its属性作为输入模型的特征进行特征编码,并对独热编码和HHb l its属性的末尾添加列进行补齐,以适应长度一固定长度的滑窗;针对于a l pha跨膜蛋白序列中的每一个残基,经过滑窗之后,得到一张特征图,每个特征图对应包括二级结构标签和拓扑结构标签在内的两个标签;将新的a l pha跨膜蛋白序列输入深度学习模型,执行数据预处理、特征编码和预测输出。具有能够同时预测a l pha跨膜蛋白的二级结构和拓扑结构的优点。
技术领域
本发明涉及计算机技术领域,尤其涉及计算生物学在蛋白质结构预测领域的应用,具体涉及一种alpha跨膜蛋白二级与拓扑结构预测方法及系统。使用深度学习方法从蛋白序列出发预测蛋白质的二级结构指标。
背景技术
膜蛋白是多种重要生物机制和生物学过程的参与者,承担了主要的生物膜功能。而跨膜蛋白作为膜蛋白中非常具有代表性的一类,贯穿、横跨了生物膜的两端,在完整生物膜的一个分子生命周期中起到了门户或受体的作用。跨膜蛋白涉及多种生命过程,如细胞力学调节、信号转导、分子转运等。同时,它们还与许多类型的疾病有关,如自闭症、血脂异常、和各种类型的癌症等。跨膜蛋白在基础生理学和病理生理学中扮演着多种角色,准确获知跨膜蛋白的结构对于药物研发、解释生命活动等都有着重要的意义,然而现阶段对于蛋白质晶体结构的测定成本高、耗时长,故使用计算方法对蛋白质结构进行辅助预测是一项非常有意义的工作。
使用计算方法从氨基酸序列出发预测蛋白质的三级结构一直非常有挑战性。在谷歌的AlphaFold2发布之前,一直没有能够非常准确预测蛋白质三级结构的计算工具,而AlphaFold2是不开源的,同时也存在一定的缺陷。在这样的背景下,通过预测一些间接的二级结构层面的指标,例如蛋白质的二级结构以及拓扑结构,便可以在保证被预测指标准确性的同时,侧面反映蛋白质的三级结构信息。自从1951年蛋白质二级结构预测首次被提出,已经有许多类似的工作在蛋白质结构预测中取得了显著的成果。值得一提的是,由于跨膜蛋白和水溶蛋白的化学性质不同、结构有很大差异,所以针对跨膜蛋白和针对水溶蛋白的工具往往无法互相通用。
蛋白质二级结构预测通常是将蛋白质序列以片段为单位分为3大类,分别为“螺旋(Helix)”,“桶(Strand)”和“转角(Coil)”,进行预测,而如果对这三大类进一步分类可以有更细的划分方法。而跨膜蛋白拓扑结构预测可以将蛋白质序列以片段为单位分为“膜内”、“膜外”和“跨膜区”或者简单地划分为“跨膜区”及“非跨膜区”。在本发明中,我们所说的二级结构预测指的是“螺旋(Helix)”,“桶(Strand)”和“转角(Coil)”的三分类,拓扑结构预测指的是“跨膜区”及“非跨膜区”二分类。
近些年针对跨膜蛋白二级结构层面预测问题涌现了一批工具,例如跨膜蛋白溶剂可及表面积预测工具TMP-SSurface、跨膜蛋白拓扑结构预测工具DMCTOP,跨膜蛋白残基距膜中心垂直距离预测工具TM-ZC等。值得一提的是,最近涌现的一大批性能较好的新预测工具都是基于深度学习方法进行开发的,而不同于以往的机器学习或者统计方法,这表明深度学习在大序列样本学习任务上具有传统机器学习所不具备的优势。
目前已经有非常多的蛋白质二级结构预测工具,比较具有代表性的有SSpro5、PSIPRED 4、RaptorX-Property、Porter 5、Spider3、SPOT-1D、MUFOLD-SSW、JPred4等。同时也有非常多预测跨膜蛋白拓扑结构的工具,例如HMMTOP 2、OCTOPUS、TOPCONS、Philius、PolyPhobius、SCAMPI、SPOCTOPUS等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332960.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于新楼盘用电信息的企业逃税稽查方法及系统
- 下一篇:一种取纱及搬运小车