[发明专利]药物设计中配体分子特征筛选装置和筛选方法在审
申请号: | 201810173915.0 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108399316A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 胡海峰;孙怡 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 徐振兴;姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配体分子 特征筛选 任务学习 药物设计 作用因素 子结构 配体 虚拟 筛选 配体相互作用 关键因素 模型构造 筛选模型 药物靶标 药物分子 鲁棒性 样本量 构建 鲁棒 发现 | ||
本发明公开了一种在药物设计中,基于多任务学习的配体分子特征筛选方法及装置。在基于配体的药物分子虚拟筛选中,对于重要的药物靶标,由于发现的配体分子数量很少,很难构建好的虚拟筛选模型。本方法将使用基于
技术领域:
本发明属于药物研发计算机辅助设计技术领域领域,特别涉及一种药物设计中配体分子特征筛选装置,还包括利用该装置的筛选方法。
背景技术:
近年来,如何提高药物虚拟筛选的有效性,如何对一些潜在的药物靶标的研究,成为新药研发的重要问题。对于无三维结构,ligand数量少的相关主体的子家族,如何虚拟筛选,成了一个必要解决的问题。而机器学习的方法,利用数据,更好的解决了这些问题
在过去的二十年中,计算机的发展使得虚拟筛选技术在药物发现过程中得到了广泛的应用。虚拟筛选是一种可靠的方法,主要是在小分子数据库中筛选大生物的活性分子,这使得研究人员,可以不用进行成千上万次实验,节省了大量的人力物力,避免了更多的花销。而且,很多大分子在体外的状态很不稳定,难于通过实验的方法得到这些大分子蛋白质的三维结构。利用虚拟筛选的方法,可以有效的解决这个问题。药物虚拟筛选的方法分为基于靶标结构和基于配体的两类方法。基于靶标结构的药物虚拟筛选模拟化合物与靶标之间的物理相互作用来确定是否可能存在药效,如分子对接方法。基于配体的方法主要是在靶标结构未知的情况下,利用已有的数据对化合物的活性进行预测。这类方法最关键的是使用各种方法或分子指纹对化合物进行充分的描述,以研究该化合物是否具有类似活性或治病机理,或归纳得到对化合物活性起关键作用的一些基团的信息。在基于配体的药物虚拟筛选中,配体分子的分子指纹表征是关键。常用的分子指纹有:子结构键的分子指纹(MACCS,PubChem)等,环形指纹(ECFP,FCFP)等。这些都是用不同的0,1码来表示配体的特征。
对于一些大分子化合物,虽然是重要的药物靶标,但是发现的配体数量很少,很难构建好的虚拟筛选模型。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容:
本发明的目的在于提供一种药物设计中配体分子特征筛选方法,从而克服上述现有技术中的缺陷。
为实现上述目的,本发明提供了一种药物设计中配体分子特征筛选方法,其特征在于,包括如下步骤:
(1)获取所需要的初始数据集;
(2)配体分子的特征生成;
(3)获取各个配体药物靶标作用的活性值;
(4)利用多任务学习的方法,进行特征筛选。
相似子家族,子家族中主体与配体药物靶标相互作用有很多共同关键因素。联合分析多种主体与配体药物靶标的相互作用,发现共同的作用因素和各自独特的作用因素对于开发新药有重要的意义。多任务学习的方法大致可以总结为挖掘不同任务之间隐藏的共有数据特征,相比于单任务学习,性能更加优良。与单任务学习相比,多任务学习的优势在于考虑了任务之间的联系,把一个任务可以分为多个子任务去学习,多任务学习的优势就在于能发掘各个子任务之间的关系,同时又能区分这些任务之间的差别。当每个药物靶标的配体样本数量比较少的时候。我们采用多任务学习的方法,结合任务与任务之间的亲缘关系,提高了模型的鲁棒性,这样可以帮助我们筛选出独特特征、关键特征和无关特征。
本发明进一步限定的技术方案为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810173915.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种Bcr-Abl蛋白激酶抑制剂的筛选方法
- 下一篇:计费式授权管理方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用