[发明专利]一种面向小分子药物虚拟筛选的多源迁移学习方法和装置在审
申请号: | 202010854924.3 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112086139A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 袁露;吴建盛;胡海峰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/50;G16C20/64;G16C20/70;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 分子 药物 虚拟 筛选 迁移 学习方法 装置 | ||
1.一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,包括以下步骤:
(1)获取同源数据集,并对其采样,获得经过采样后的同源数据集;
(2)输入配体分子smiles和生物活性值,在图神经网络中训练得到虚拟筛选模型;
(3)将采样后的同源数据集放到虚拟筛选模型中训练,得到模型参数;
(4)预测配体分子与药物靶标结合的生物活性值。
2.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(1)包括:
(1.1)选择同源药物靶标;
(1.2)对获取所需的同源药物靶标数据集,其中,所述的初始数据集包括同源药物靶标的信息,所述信息包括所需要的配体分子smiles和配体作用的活性值;
(1.3)对同源药物靶标对应的数据集随机有放回采样,设置采样比率,重复几次,获得经过采样后的子同源数据集。
3.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(2)包括:
(2.1)获取目标药物靶标数据集T,其中,所述的初始数据集包括同源药物靶标的信息,所述信息包括所需要的配体分子smiles和配体作用的活性值;
(2.2)利用公式通过卷积操作生成配体分子的分子指纹,记为f;
(2.3)利用公式生成配体分子的加权分子指纹,记为F;
(2.4)利用生成的分子指纹,通过两层全连接层,预测出生物活性值,
4.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(3)包括:
(3.1)获取步骤(1)生成的多个子同源数据集,数据集包括所述信息包括所需要的配体分子smiles和配体作用的活性值;
(3.2)将每一个子源域数据集通过步骤(2)生成的药物小分子虚拟筛选模型中训练,并获取模型参数;
(3.3)将目标域数据集输入到虚拟筛选模型中,并将虚拟模型中的原始参数置换为上一步得到的模型参数。获得目标域预测的生物活性值。
5.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(4)包括:
(4.1)比较多个子源域训练得到的目标域生物活性值的可靠性,并用相关系数来衡量;
(4.2)选取其中相关系数最大的几个子源域,并将它们对应的生物活性值取平均值,作为最终预测的生物活性值;
(4.3)将最终预测的生物活性值与实际的活性值作比较,并用相关系数r2来衡量预测的可靠性。
。
6.一种面向小分子药物虚拟筛选的多源迁移学习装置,其特征在于,由以下模块组成:
同源数据集生成模块,用于获取子同源数据集;
虚拟筛选模块,用于构建虚拟筛选模型;
多源迁移模块,利用同源药物靶标的配体分子信息,帮助构建目标药物靶标虚拟筛选模型;
活性值预测模块,用于预测配体分子与药物靶标结合后的活性值大小和评价所述虚拟筛选模型的性能。
7.根据权利要求6所述的一种面向小分子药物虚拟筛选的多源迁移学习装置,其特征在于,同源数据集生成模块包括:从uniprot数据库中下载药物标靶数据集,获得的数据集包括配体分子的smiles分子式以及配体分子与药物靶标作用的活性值;利用有放回采样的方式,对数据集采样,输出获得经过采样的数据集。
8.根据权利要求6所述的一种面向小分子药物虚拟筛选的多源迁移学习装置,其特征在于,所述虚拟筛选模块为:预测配体分子与药物靶标的生物活性值,输入:smiles格式的化合物,输出:所述药物靶标作用的生物活性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010854924.3/1.html,转载请声明来源钻瓜专利网。