[发明专利]药物预测方法及模型的训练方法、装置、电子设备及介质在审
申请号: | 202110007460.7 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112331261A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 王凡;何径舟;方晓敏;薛洋;刘荔行;张肖男;吴华;吴甜;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G16B15/30 | 分类号: | G16B15/30 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 预测 方法 模型 训练 装置 电子设备 介质 | ||
本公开公开了一种药物预测方法及模型的训练方法、装置、电子设备及介质,涉及机器学习与智能医疗等人工智能技术领域。具体实现方案为:获取数个训练靶点的药物数据集;基于各所述训练靶点的药物数据集,对所述药物预测模型进行训练。另外,还公开了一种药物信息预测方法和药物数据的生成方法。根据本公开的技术,能够使得训练的药物预测模型的准确性更高,能够有效地提高训练的药物预测模型的训练效果。且基于训练得到的药物预测模型,可以预测预设靶点的预测药物的信息,能够提供一种有效地、能够提供良好成药分子的药物信息设计方案。而且,能够有效地提高生成的预测药物信息的准确性。
技术领域
本公开涉及计算机技术领域,具体涉及机器学习与智能医疗等人工智能技术领域,尤其涉及一种药物预测方法及模型的训练方法、装置、电子设备及介质。
背景技术
人类疾病的靶点通常是疾病发展中具有关键作用的蛋白质,亦可以称为蛋白质靶点。药物通过和靶点蛋白质的结合来使得对应的蛋白质丧失原有功能,从而实现疾病的抑制作用。
在新药研发过程中,针对特定的蛋白质靶点(Target),需要快速搜索药物的化合物空间,找到能够和蛋白质靶点进行结合的化合物(Compound),进而形成可以用于治疗的药物。传统方法中,通过有经验的专家,对蛋白质靶点进行研究和估计,并且尝试设计可能的化合物,并对化合物与蛋白质靶点的亲和度(Binding Affinity)进行估计和筛选。传统方法依赖于经验和运气,对于新药的发现有较大的不确定性。
发明内容
本公开提供了一种药物预测方法及模型的训练方法、装置、电子设备及介质。
根据本公开的一方面,提供了一种药物预测模型的训练方法,其中,所述方法包括:
获取数个训练靶点的药物数据集;
基于各所述训练靶点的药物数据集,对所述药物预测模型进行训练;所述药物预测模型包括特征处理模块、编码模块和解码模块;其中,
所述特征处理模块,对于各所述训练靶点的药物数据集中的各药物,将对应的药物的特征表达、所述药物与对应的所述训练靶点的特征表达以及所采用的随机向量表达拼接,得到综合特征表达;
所述编码模块,对所述药物数据集中的各所述药物对应的所述综合特征表达进行编码处理,得到编码后的特征表达;
所述解码模块,基于各所述药物对应的所述编码后的特征表达进行解码处理,生成并输出对应的所述训练靶点的预测药物的信息。
根据本公开的另一方面,提供了一种药物信息预测方法,其中,所述方法包括:
获取预设靶点的药物数据集;
基于所述预设靶点的药物数据集,采用预先训练的药物预测模型,预测所述预设靶点的预测药物的信息;所述药物预测模型包括特征处理模块、编码模块和解码模块;其中,
所述特征处理模块,对于所述预设靶点的药物数据集中的各药物,将所述药物数据集中各药物的特征表达、所述预设靶点的特征表达以及所采用的随机向量表达拼接,得到综合特征表达;
所述编码模块,对所述药物数据集中的各所述药物对应的所述综合特征表达进行编码处理,得到编码后的特征表达;
所述解码模块,基于各所述药物对应的所述编码后的特征表达进行解码处理,生成并输出对应的所述预设靶点的所述预测药物的信息。
根据本公开的再一方面,还提供了一种药物数据的生成方法,其中,所述方法包括:
基于预设靶点对应的药物数据集,采用预先训练的药物预测模型,生成所述预设靶点的预测药物的信息;
基于所述预测药物的信息和所述预设靶点,检测所述预测药物与所述预设靶点的亲和度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110007460.7/2.html,转载请声明来源钻瓜专利网。