[发明专利]一种基于空间结构的蛋白质相互作用预测方法有效
申请号: | 201910979313.9 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110853702B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 张利达;雷雨;洪剑伟;郑存俭;赵佳薇 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/30;G16B40/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
地址: | 200030 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空间结构 蛋白质 相互作用 预测 方法 | ||
本发明涉及一种基于空间结构的蛋白质相互作用预测方法,该方法包括如下步骤:(1)采集蛋白质三维空间结构标准数据;(2)构建蛋白质相互作用正、负样本数据集;(3)提取正、负样本数据集中的蛋白质三维空间结构标准数据的结构矩阵;(4)构建用于蛋白质相互作用预测的深度学习模型;(5)将正、负样本集中的结构矩阵输入至深度学习模型,训练深度学习模型;(6)获取目标蛋白质三维空间结构数据;(7)提取目标蛋白质三维空间结构数据的结构矩阵;(8)深度学习模型预测得到目标蛋白质相互作用的概率。与现有技术相比,本发明蛋白质三维空间结构数据能够提高模型对蛋白质相互作用的识别能力,大大提高蛋白质相互作用的预测准确性。
技术领域
本发明涉及一种蛋白质相互作用预测方法,尤其是涉及一种基于空间结构的蛋白质相互作用预测方法。
背景技术
蛋白质之间的相互作用是蛋白质行使功能的基础,蛋白质相互作用参与了生物体几乎所有的生命活动,在各种生理生化过程中都发挥着重要作用。目前研究蛋白 质相互作用的实验方法,如串联亲和纯化、酵母双杂交和蛋白质芯片技术等方法费 时费力,花费昂贵,且具较高的假阳性率等缺点。因此,基于计算方法研究蛋白质 相互作用日趋受到关注。随着基因组测序成本的不断降低,各组学数据激增,为综 合利用生物大数据进行蛋白质相互作用预测提供了丰富的数据资源。
低温冷冻电镜、X射线晶体衍射、多维核磁共振等结构生物学实验技术测得了 部分蛋白质的三维结构。目前蛋白质结构数据库收录了超过15万个蛋白质三维结 构,其多集中在人类、小鼠、酿酒酵母以及大肠杆菌等模式生物。但由于蛋白质三 级结构的以及结构域的保守性,如蛋白质序列一级结构具有相似性,那么其三级结 构具有高度相似性。蛋白质三维结构的保守性促成了以数据库中的已知结构为模板 的同源建模(HomologyModeling)方法的发展,该方法是目前应用最广泛的蛋白 质三维结构预测方法。随着数据库中的已知结构的蛋白质数量的不断增加,使得越 来越多的蛋白质可通过同源建模方法获得精确的预测结构。同源建模得到的蛋白质 三维结构数据能够成为预测蛋白质相互作用的重要数据支撑。
机器学习技术(如支持向量机、随机森林和朴素贝叶斯)在面对生物数据时, 需要人工设计特征提取器,用来将原始的生物数据转化成统一的向量或矩阵形式, 这要求设计者拥有高超的结构生物学知识和优秀的算法编译能力。深度学习是机器 学习中一种基于对数据进行表征学习的方法。深度学习通过非监督式学习或半监督 式学习来获取特征,而不需要通过人工来获取特征,在处理复杂的生物学数据上具 有优势。目前深度学习已成功应用于语音识别、记忆网络、计算机视觉、自然语言 处理等其他领域。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于空间结 构的蛋白质相互作用预测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于空间结构的蛋白质相互作用预测方法,该方法包括如下步骤:
(1)采集蛋白质三维空间结构标准数据;
(2)利用三维空间结构标准数据构建蛋白质相互作用正、负样本数据集;
(3)提取正、负样本数据集中的蛋白质三维空间结构标准数据的结构矩阵;
(4)构建用于蛋白质相互作用预测的深度学习模型;
(5)将正、负样本集中的结构矩阵输入至深度学习模型,训练深度学习模型;
(6)对目标蛋白质序列进行同源建模获取目标蛋白质三维空间结构数据;
(7)提取目标蛋白质三维空间结构数据的结构矩阵;
(8)将目标蛋白质的结构矩阵输入至训练好的深度学习模型预测得到目标蛋 白质相互作用的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910979313.9/2.html,转载请声明来源钻瓜专利网。