[发明专利]基于深度学习的药物分子生成方法在审
申请号: | 201910818097.X | 申请日: | 2019-09-26 |
公开(公告)号: | CN110534164A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 邓代国;洪晓彬;雷曾荣;艾海涛 | 申请(专利权)人: | 广州费米子科技有限责任公司 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510335 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分子数据 训练模型 药物分子 迁移 学习 训练阶段 神经网络模型 循环神经网络 合成性 药分子 靶点 药性 语法 | ||
本发明是一种基于深度学习的药物分子生成方法,采用循环神经网络作为学习和生成药物分子的神经网络模型。该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
技术领域
本发明属于药物分子领域,特别涉及基于深度学习的药物分子生成方法。
背景技术
药物是用以预防、治疗及诊断疾病的物质。在理论上,药物是指凡能影响机体器官生理功能及细胞代谢活动的化学物质都属于药物的范畴。
在公告号CN109741798A,名称为“有机分子的立体异构全集自动化生成方法”的中国发明专利中,公开了一种有机分子的立体异构全集自动化生成方法,(1)将输入分子切分成一组片段;(2)用得到的异构片段到片段模板库中匹配片段模板;(3)根据片段模板信息生成出对应片段的所有异构;(4)遍历所有的异构片段及其位点,将步骤(1)中断的键两端的片段,按断键原子的所有可能的位点进行组装,得到所有的立体异构;如果需要过滤,则可以按照指定的过滤规则进行过滤。本发明可以很方便的描述相似片段的立体异构,并大量减少片段数量,极大地降低片段库的构建难度。分片段,再遍历片段的所有立体异构,然后根据位点组合拼装,可以容易地生成一个分子的所有立体异构。
以上公开的专利通过遍历所有的异构片段及其位点,按断键原子的所有可能的位点进行组装,得到所有的立体异构,再遍历片段的所有立体异构,然后根据位点组合拼装,生成一个分子的所有立体异构,但是以上立体异构的获得过于复杂,成本较高,并不利于新药物的发现和研发。
目前药物研发中,新药分子的发现主要有两种技术,高通量药物筛选(HTS)和基于片段的药物设计(FBDD)。HTS是一种利用已有的化合物进行的体外的实验筛选,而FBDD是挑选有利的片段组合或延伸得到新药物分子,获得高活性的候选药物;以上两种方法均存在盲目性大、生物实验次数较多、成本大、对于部分药物靶点很难筛选到理想的化合物、命中化合物的类药性较差的缺点。
发明内容
为解决上述问题,本发明的目的在于提供一种不需要具体的生物实验、高效、低成本的基于深度学习的药物分子生成方法。
本发明的另一个目的在于提供可以生成类药性好、可合成性好、具有指定靶点的活性的、有新的骨架的新分子的基于深度学习的药物分子生成方法。
为实现上述目的,本发明的技术方案如下。
一种基于深度学习的药物分子生成方法,其特征在于,该方法的具体操作步骤如下:
S1:通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;
S2:通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;
S3:通过生成阶段,利用迁移训练模型生成分子数据。
该方法通过预训练阶段学习已知的类药分子的语法和特征,得到预训练模型;通过迁移训练阶段,使用预训练模型,学习某个具体靶点的药物分子的特征,得到迁移训练模型;通过生成阶段,利用迁移训练模型生成分子数据,这些生成的分子数据与迁移学习学习的分子数据,具备类似的活性、类药性、可合成性,同时这些生成的分子数据具有大量新的分子和新的骨架。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州费米子科技有限责任公司,未经广州费米子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910818097.X/2.html,转载请声明来源钻瓜专利网。