[发明专利]一种基于生物活性指纹的分子相似度计算方法及系统在审
申请号: | 202211683470.3 | 申请日: | 2022-12-27 |
公开(公告)号: | CN116013406A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 张继贤;郑双佳;陆威 | 申请(专利权)人: | 星希尔生物科技(上海)有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G06N3/08;G06N3/0442 |
代理公司: | 北京中南长风知识产权代理事务所(普通合伙) 11674 | 代理人: | 穆丽红 |
地址: | 200131 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生物 活性 指纹 分子 相似 计算方法 系统 | ||
本发明公开了一种基于生物活性指纹的分子相似度计算方法,包括:基于分子与靶点蛋白的生物活性数据对分子图进行预训练获得用于表征分子的图神经网络,基于图神经网络获得分子中每个原子的预训练向量化映射;将分子分解目标分子与查询分子,得到相应的子图;对子图的每一个节点中的所有原子的预训练向量化映射求和,作为该节点在对应子图中的表征ssubgt;i/subgt;;遍历两个子图的最大公共子图可能性,并计算两个子图中查询分子和目标分子各个节点之间的谷本相似系数,最大公共子图谷本相似系数作为两个分子的相似度。还公开了对应系统及应用。为基于配体的药物发现带来极大的便利,降低相关工作人员对领域知识的依赖,提高药物设计和开发的效率,缩短研发周期。
技术领域
本发明属于生物基因技术领域,尤其涉及一种基于生物活性指纹的分子相似度计算方法及系统。
背景技术
如何预测配体的生物活性是药物发现中的一个关键挑战。定量结构-活性关系(QSAR)是一个基本的方法,但需要大量特定靶点的数据。早期的药物发现过程通常从一个或几个活性化合物开始。一个基本假设是结构相似的分子具有相似的生物活性。所以寻找与已知的活性参考分子最相似的化合物是基于配体虚拟筛选(LBVS)方法中的一个关键挑战。分子指纹的谷本(Tanimoto)系数是评估分子相似性的最传统方法。然而,分子指纹相似性随着骨架的变化而急剧下降,因为在分子指纹中,所有分子的变化都是等距离的,因此,只用分子指纹相似度很难实现骨架跃迁。
近年来,部分学者提出了基于三维结构的分子相似度计算方法。其中Flexi-LS-align方法可以进行柔性分子结构的原子级配体结构相似度计算。EViS方法进一步考虑了蛋白质-配体复合物的结构,它采用了结构生物学数据库中蛋白质-配体模板来计算相似度。但这些相似度计算方法都涉及到配体甚至复合物的三维结构,计算成本很高。
最新的研究采用深度学习技术,如图神经网络(GNN)来学习分子的信息表示。这些方法大多数都集中在很少包含生物活性信息的无标签数据上,最重要的原因是用于监督训练的标记分子不足。但随着公开的大规模生物活性数据库和研究数据的发展,有价值的标签数据正在增加。基于一个化合物与一组靶点的相互作用而衍生出的具有生物学意义的标签已经达到了可用的规模。
因此,上述的现有技术确实有待提出更佳解决方案的必要性。
发明内容
本发明的目的是提供一种基于生物活性指纹的分子相似度计算方法、系统及应用,首先收集分子与靶点蛋白的生物活性数据,然后利用百万级别的活性数据来预训练用于分子表征的图形神经网络(GNN),通过上述过程可以获得用于表征分子的预训练图神经网络,再通过子图(reduced graph)的最大公共子图可以计算任意两个分子之间的相似度,将这些生物信息表征用于对齐分子图以计算相似度,从而实现更高效的骨架跃迁。
本发明一方面提供了一种基于生物活性指纹的分子相似度计算方法,包括:
S1,基于分子与靶点蛋白的生物活性数据对分子图进行预训练获得用于表征分子的图神经网络,基于所述图神经网络获得分子中每个原子的预训练向量化映射(embedding);
S2,将所述分子分解目标分子与查询分子,得到相应的子图(reduced graph);
S3,对子图(reduced graph)的每一个节点中的所有原子的预训练向量化映射(embedding)求和,作为该节点在对应子图中的表征si;
S4,遍历两个子图(reduced graph)的最大公共子图可能性,并基于所述可能性和所述节点在对应子图中的表征计算两个子图中查询分子和目标分子各个节点之间的谷本(tanimoto)相似系数,其中最大公共子图谷本(tanimoto)相似系数作为两个分子的相似度。
优选的,所述用于表征分子的图神经网络为GAT,所述基于分子与靶点蛋白的生物活性数据对分子图进行预训练获得用于表征分子的图神经网络包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星希尔生物科技(上海)有限公司,未经星希尔生物科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211683470.3/2.html,转载请声明来源钻瓜专利网。