[发明专利]一种训练分子结合模型的方法、分子筛选方法及装置在审
申请号: | 202111213797.X | 申请日: | 2021-10-19 |
公开(公告)号: | CN114283899A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 卞亚涛;徐挺洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/20;G16C20/70;G16C20/64 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 分子 结合 模型 方法 筛选 装置 | ||
本申请提供一种训练分子结合模型的方法、分子筛选方法及装置,可以应用于智能医疗领域,用于解决分子筛选准确性较低的问题。该方法包括:采用待训练的分子结合模型,基于蛋白质特征信息和分子特征信息,确定样本蛋白质分子与样本备选分子之间的结合活性特征信息、嵌入特征信息和共晶特征信息,其中,嵌入特征信息用于表征样本蛋白质分子与样本备选分子之间的结合程度,共晶特征信息用于表征样本蛋白质分子和样本备选分子之间是否存在共晶结构,待训练的分子结合模型用于预测;基于结合活性特征信息、嵌入特征信息和共晶特征信息,确定待训练的分子结合模型的训练损失。
技术领域
本申请涉及生物医药技术领域,尤其涉及一种训练分子结合模型的方法、分子筛选方法及装置。
背景技术
随着科技的不断发展,越来越多的设备可以采用活性预测模型,预测分子虚拟结合后的化合物的结合活性,从而,可以基于预测出的化合物的结合活性,筛选出一些分子进行真实的药物结合实验。
在对分子虚拟结合后的化合物的结合活性进行预测时,通常活性预测模型是基于特征提取模型提取出的分子的化学性质特征,或分子自身的结构特性来进行预测的。
然而,在分子结合过程中,并不是简单的将两个分子放在一起,分子之间可能还存在相互作用等一些难以预知的情况,仅从分子自身角度出发,预测出的分子虚拟结合后的化合物的结合活性准确性较低,从而造成分子筛选的准确性较低。
发明内容
本申请实施例提供一种训练分子结合模型的方法、分子筛选方法、装置、计算机设备及存储介质,用于解决分子筛选准确性较低的问题。
第一方面,提供一种训练分子结合模型的方法,包括:
获得各个样本蛋白质分子各自的蛋白质特征信息,以及获得各个样本备选分子各自的分子特征信息;
基于各个蛋白质特征信息和各个分子特征信息,对待训练的分子结合模型进行多轮迭代训练,直到所述待训练的分子结合模型的训练损失满足训练目标时,输出所述待训练的分子结合模作为目标分子结合模型,其中,针对多轮迭代训练,分别执行以下操作:
采用所述待训练的分子结合模型,基于蛋白质特征信息和分子特征信息,确定所述样本蛋白质分子与所述样本备选分子之间的结合活性特征信息、嵌入特征信息和共晶特征信息,其中,所述结合活性特征信息用于表征所述样本蛋白质分子与所述样本备选分子进行虚拟结合后的活性,所述嵌入特征信息用于表征所述样本蛋白质分子与所述样本备选分子之间的结合程度,所述共晶特征信息用于表征所述样本蛋白质分子和所述样本备选分子之间是否存在共晶结构,所述待训练的分子结合模型用于预测;
基于所述结合活性特征信息、所述嵌入特征信息和所述共晶特征信息,确定所述待训练的分子结合模型的训练损失。
第二方面,提供一种分子筛选方法,包括:
获得目标蛋白质分子和目标备选分子;
采用特征提取模型,对所述目标蛋白质分子和所述目标备选分子进行特征提取处理,获得所述目标蛋白质分子的目标蛋白质特征信息和所述目标备选分子的目标分子特征信息;
采用所述目标分子结合模型,基于所述目标蛋白质特征信息和所述目标分子特征信息,确定所述目标蛋白质分子和所述目标备选分子之间的结合活性特征信息;
采用活性预测模型,基于结合活性特征信息,预测所述目标蛋白质分子和所述目标备选分子进行虚拟结合后的活性值。
第三方面,提供一种训练分子结合模型的装置,包括:
获取模块:用于获得各个样本蛋白质分子各自的蛋白质特征信息,以及获得各个样本备选分子各自的分子特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111213797.X/2.html,转载请声明来源钻瓜专利网。