[发明专利]一种基于深度参数迁移学习的小分子药物虚拟筛选方法和装置在审
申请号: | 202010854913.5 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112086146A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 卢宁;吴建盛;王俊 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/64;G16C20/50;G16C20/30;G06N3/08;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 参数 迁移 学习 分子 药物 虚拟 筛选 方法 装置 | ||
本发明提供一种基于深度参数迁移学习的小分子药物虚拟筛选方法及装置,包括:分子指纹表示数据集中的配体样本特征;基于组稀疏学习进行特征选择,得到关键子结构;基于深度参数迁移学习的配体小分子的活性预测。本发明先通过训练样本丰富的相似药物靶标训练出好的深度学习模型,根据相似的药物靶标容易拟合到相似的深度学习模型的假设,利用刚学习好的模型参数对目标药物靶标的深度学习模型进行初始化,最后利用目标药物靶标有限的训练样本对模型进行优化更新。基于深度参数迁移学习的方法可以用来尝试解决药物虚拟筛选训练数据集中配体样本不足的问题,其对新靶标的虚拟筛选、理解配体与靶标相互作用和对配体分子的优化具有潜在的应用价值。
技术领域
本申请涉及药物虚拟筛选方法及装置,特别涉及一种基于深度参数迁移学习的小分子药物虚拟筛选方法与装置。
背景技术
在药物研发过程中先导化合物是通过各种途径和手段得到的具有某种生物活性和化学结构的化合物,用于进一步的结构改造和修饰,是现代新药研究的出发点。在新药研究过程中,通过化合物活性筛选而获得具有生物活性的先导化合物是创新药物研究的基础。
传统的药物筛选需要耗费大量的人力物力,存在着实验周期长等一系列缺点。随着21世纪计算机的快速发展,虚拟药物筛选技术已经广泛地应用到药物研发过程中,尤其在新的药物靶标和罕见疾病先导化合物结构发现方面起到了关键的作用。
虚拟筛选,也称计算机筛选,即在进行生物活性筛选之前,利用计算机上的分子对接软件模拟目标靶点与候选药物之间的相互作用,计算两者之间的活性值大小,以降低实际筛选化合物数目,同时提高先导化合物发现效率。其中,虚拟筛选可以分为两类,即基于受体的虚拟筛选和基于配体的虚拟筛选。基于配体的虚拟筛选受到实验条件的限制,部分配体的样本数量比较少。
近年来,对一些新的药物靶标和罕见疾病的研究,成为新药研发的重要问题。现有技术中,一般的虚拟筛选的方法在进行筛选的时候,需要收集大量的样本数据。因此,在提供的是小样本的时候,就会因为缺乏足够的样本数量而导致很难构建出好的虚拟筛选的模型。
发明内容
发明目的:为了解决上述技术问题,本发明的第一目的是提供一种对新靶标的虚拟筛选、理解配体与靶标相互作用和对配体分子的优化具有潜在的应用价值的、适合小样本的、基于深度参数迁移学习的小分子药物虚拟的筛选方法;
本发明的第二目的是提供基于深度参数迁移学习的小分子药物虚拟筛选装置。
技术方案:本申请提出了一种基于深度参数迁移学习的小分子药物虚拟筛选方法,包括:
(1)分子指纹表示数据集中的配体样本特征;
(2)基于组稀疏学习进行特征选择,得到关键子结构;
(3)基于深度参数迁移学习的配体小分子的活性预测。
优选地,所述步骤(1)包括:
获取所需要的初始数据;其中,所述的初始数据集包括药物靶标及其同源药物靶标的信息,所述信息包括所需要的配体分子式和配体产生作用所需的活性值;
利用ECFP分子指纹表征初始数据集中的配体样本,输入所述配体分子式,得到特征对应的0/1值,并做-lg处理。
进一步地,所述步骤(2)进一步包括:
针对目标域和源域,利用ECFP分子指纹或者分子描述表征配体样本,提取配体作用生物活性,采用多任务稀疏学习方法,筛选目标域和源域中药物靶点与配体相互作用的共同特征及独有特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010854913.5/2.html,转载请声明来源钻瓜专利网。