[发明专利]蛋白质与小分子样本生成及结合能、结合构象预测方法在审
申请号: | 202011012500.9 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112289371A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 殷实秋;周杰龙 | 申请(专利权)人: | 北京望石智慧科技有限公司 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 林韵英 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 分子 样本 生成 结合能 结合 构象 预测 方法 | ||
本发明提供一种蛋白质与小分子样本生成及结合能、结合构象预测方法,其中,小分子和蛋白质结合样本生成方法,包括:当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断目标给体和目标受体是否存在相互作用;当目标给体与目标受体存在相互作用,则按照预设规则,建立目标给体与目标受体的空间构象数据,得到小分子和蛋白质结合样本。通过实施本发明对目标给体和受体部分进行筛选,并根据筛选出的目标给体和受体按照预设规则建立三维空间矩阵作为样本,根据已有知识,简化小分子和蛋白质结合时的分析模型,对样本引入先验知识,从而在后续模型训练时,可以通过较少的样本实现模型的训练,降低数据处理量以及训练过程耗费时长。
技术领域
本发明涉及生物技术领域,具体涉及蛋白质与小分子样本生成及结合能、结合构象预测方法。
背景技术
蛋白质作为生物体的重要组成部分,几乎参与了生物体的所有生命活动,比如催化、免疫、代谢,在这些过程中大多涉及到蛋白质和小分子之间的相互作用。通常药物小分子活性通过与目标蛋白的结合能体现,因此预测小分子和蛋白的结合能是一项重要的课题。
相关技术中,利用神经网络实现结合能的预测,该神经网络以蛋白质-配体相互作用的全面三维表示作为输入,神经网络自动学习与结合相关的蛋白质-配体相互作用的关键特征,通过大量样本训练和优化神经网络评分功能,预测其结合能。但通过此种方式需要大量的训练样本,数据处理量大,且训练过程耗费时间较长。
发明内容
有鉴于此,本发明实施例提供了一种蛋白质与小分子样本生成及结合能、结合构象预测方法,以解决现有技术中需要大量的训练样本,数据处理量大,且训练过程耗费时间较长的缺陷。
根据第一方面,本发明实施例提供一种小分子和蛋白质结合样本生成方法,包括如下步骤:当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断所述目标给体和目标受体是否存在相互作用;当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。
可选地,所述目标给体和目标受体的相互作用包括氢键相互作用、卤键相互作用、疏水基团相互作用、芳香环相互作用。
可选地,判断所述目标给体和目标受体是否存在相互作用包括:确定所述目标给体与所述目标受体的作用范围;根据所述目标给体与所述目标受体的作用范围确定所述目标给体与所述目标受体是否存在相互作用。
可选地,所述确定所述目标给体与所述目标受体的作用范围,包括:当目标给体和目标受体的相互作用为氢键相互作用时,作用范围为以所述氢键和所述目标受体为中心,半径4.5埃的圆形区域;当所述目标给体和目标受体的相互作用为卤键相互作用时,作用范围为以所述卤键和所述目标受体为中心,半径4.5埃的圆形区域;当所述目标给体和目标受体的相互作用为疏水基团相互作用时,作用范围为以所述疏水基团和所述目标受体为中心,半径6埃的圆形区域;当所述目标给体和目标受体的相互作用为芳香环相互作用时,作用范围为以所述芳香环和所述目标受体为中心,半径6埃的圆形区域。
根据第二方面,本发明实施例提供一种小分子和蛋白质结合能预测模型训练方法,包括如下步骤:获取第一方面或第一方面任一实施方式所述分子样本;将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京望石智慧科技有限公司,未经北京望石智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011012500.9/2.html,转载请声明来源钻瓜专利网。