[发明专利]蛋白质-配体复合物的分类方法及分类装置在审
申请号: | 201911275518.5 | 申请日: | 2019-12-12 |
公开(公告)号: | CN112966702A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 张海平;魏彦杰 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16B50/00 |
代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 复合物 分类 方法 装置 | ||
本发明公开了蛋白质‑配体复合物的分类方法,针对蛋白质‑配体复合物分类的实际运用中负样本数据主导,引入非结合蛋白质‑配体复合物的信息作为负样本,进行本发明基于深度学习神经网络所开发构建的残基神经网络二分类模型DeepBindBC的训练,以该模型实现分类。由于结合负样本所构建的模型能更全面学习数据,训练数据分布更接近实际运用,因此能够准确地完成分类,实现帮助在现实药物虚拟筛选上识别天然的蛋白质‑小分子复合物,有利于药物开发中早期步骤的进行;该模型具备充足深度;数据中蛋白质和配体的种类足够多,可靠性强;该方法包含空间信息,能与不基于结构的其他模型配合;其使用复杂的原子类型表示方法能够有效保留物理化学关键信息。
技术领域
本发明涉及蛋白质-配体复合物的技术领域,尤其是涉及蛋白质-配体复合物的分类方法及分类装置。
背景技术
小分子药物通过与疾病相关蛋白高强度高特异性结合,成为治疗疾病的重要手段之一,因此,在计算分子生物学中,识别天然的蛋白质-配体复合物(蛋白质-小分子复合物)是基于结构的药物设计的重要步骤。一些现有方法主要依靠实验性结合数据,用实验方法测定蛋白与小分子配体是否作用,需要花费大量经费,并且耗时长。
后来人们开发了一系列计算机辅助方法加速药物筛选,特别是,随着蛋白-小分子复合物的实验数据增多以及机器学习的发展,尤其是深度神经网络模型的迅速发展,不少研究人员运用机器学习或者深度学习模型预测蛋白质-小分子相互作用。其模型相对传统模型具有不少优势,一方面,深度学习模型不需要提前固定公式形式,可以随着训练过程演化,另一方面,深度学习能自动提前与目标相关的特征。较多地,现有技术基于结构的蛋白小分子对接被广泛运用于寻找小分子最佳空间作用位点以及作用方位,最后通过打分函数决定可能的最优复合物结构,构建并训练基于结构的蛋白小分子相互作用打分深度学习模型来实现分类筛选。
但是,目前这些用于蛋白与小分子相互作用的机器学习或者深度学习模型直接借助已有实验结构及实验结合来训练模型,往往缺乏负极信息(缺乏非结合蛋白质-配体复合物,或者说缺乏无作用的蛋白-小分子复合物),导致其表现在现实运用中表现欠佳。因为,现实药物虚拟筛选中,大部分复合物是无作用的蛋白质-小分子复合物(非结合蛋白质-小分子复合物),所以训练数据与实际应用数据之间的差异导致许多当前方法的性能较差,尤其是结合蛋白小分子组合在大规模虚拟筛选的实际应用中占绝大多数。
综上所述,现有技术还有待改进。
发明内容
有鉴于此,本发明的目的在于提供蛋白质-配体复合物的分类方法及分类装置,来解决上述问题。
为了实现上述的目的,本发明采用了如下的技术方案:
本发明提供了一种蛋白质-配体复合物的分类方法,包括:S1、获取结合蛋白质-配体复合物的信息作为正样本,获取非结合蛋白质-配体复合物的信息作为负样本,以所述正样本和负样本构造类图片矩阵作为输入数据;S2、构建残基神经网络二分类模型,所述残基神经网络二分类模型以所述输入数据按预设比例划分出的训练集进行训练;S3、所述残基神经网络二分类模型根据所述输入数据按预设比例划分出的验证集和测试集选择超参数,获得训练完成的残基神经网络二分类模型;S4、采用训练完成的残基神经网络二分类模型执行蛋白质-配体复合物的二分类。
优选地,从蛋白质数据库中获取结合蛋白质-配体复合物和非结合蛋白质-配体复合物的空间结构信息,采用独热编码表示维度对应蛋白质的原子类型数目的蛋白质原子类型向量和维度对应配体的原子类型数目的配体原子类型向量,以构造所述类图片矩阵。
优选地,所述结合蛋白质-配体复合物和非结合蛋白质-配体复合物的空间结构信息包括蛋白质与配体的界面接触信息,以所述正样本和负样本构造类图片矩阵作为输入数据前,采用空间聚类法对正样本和负样本中的蛋白质原子进行分类,根据聚类和原子类型选择数据输入的排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911275518.5/2.html,转载请声明来源钻瓜专利网。