[发明专利]基于三元组损失的蛋白质折叠识别方法有效
申请号: | 202010947616.5 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112116949B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 於东军;刘岩 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G06N3/04 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 岑丹 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 三元 损失 蛋白质 折叠 识别 方法 | ||
本发明公开了一种基于三元组损失的蛋白质折叠识别方法,包括以下几个步骤:使用one‑hot编码对蛋白质进行编码,将编码后的蛋白质输入到SSA程序中,得到蛋白质残基与残基之间的接触图,把接触图作为输入数据,输入到预先训练好的深度学习框架中,网络的输出就为蛋白质特定于折叠识别的特征;把查询蛋白的特征与蛋白质数据库中已知蛋白质折叠类别的模板蛋白质相比较,将距离查询蛋白最近的模板蛋白质的折叠类别被分配给查询蛋白。本发明借鉴三元组损失的训练思想,使得同类之间的蛋白质结构距离更近,不同类之间的蛋白质结构更远,从而使得蛋白质的特征表达具有更强的鉴别力,使得识别效率更高。
技术领域
本发明属于生物信息学预测蛋白质结构领域,具体为一种基于三元组损失的蛋白质折叠识别方法。
背景技术
蛋白质折叠类型的确定可以揭示生命的第二套遗传密码,具体来说就是蛋白质的一级结构是如何决定他的空间结构的方式。众所周知,蛋白质的三维结构对于研究蛋白质的功能与性质起着至关重要的作用,而正确的确定蛋白质的折叠识别又是预测蛋白质三维结构的关键一环。另外,由于蛋白质的折叠方式对蛋白质的异质性以及分子功能都有着深远的影响,所以在医药人工设计蛋白质、寻找致命机理以及包涵体复性等领域都会有着巨大的促进作用。因次,快速而准确的识别蛋白质的折叠类型对生命科学,医药科学的发展都有着重要的意义。
在研究的早期阶段,确定蛋白质的结构通常采用的是传统的实验方法,例如X射线晶体法和核磁共振光谱法。但是,这些传统的方法的缺点也十分的明显,成本高而且耗费的时间相当长。另外随着实验技术的发展以及人类结构基因组的不断推进,蛋白质数据库中累积了大量的具有已知折叠类型的蛋白质。因次应用生物信息学中的相关知识,研发能够直接快速的从蛋白质序列出发进行蛋白质的折叠识别的方法有着迫切的需求,并且对于发现和认识蛋白质的功能也有着重要的意义。
在之前的研究中,国内外的研究者提出了各种蛋白质折叠识别方法,这些方法从原理上分大致可以分为两类:基于模板的方法和基于机器学习的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947616.5/2.html,转载请声明来源钻瓜专利网。