[发明专利]基于多任务胶囊自编码器神经网络的全新分子生成方法有效

专利信息
申请号: 202011247808.1 申请日: 2020-11-10
公开(公告)号: CN112270951B 公开(公告)日: 2022-11-01
发明(设计)人: 邹俊;杨胜勇;李侃;杨欣 申请(专利权)人: 四川大学
主分类号: G16B15/30 分类号: G16B15/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 610065 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 任务 胶囊 编码器 神经网络 全新 分子 生成 方法
【说明书】:

发明公布了一种基于多任务胶囊自编码器神经网络的全新分子生成方法,利用自编码器框架,建立了包括编码器、多任务胶囊分类器和解码器的全新分子生成模型。该方法将药物分子表示为SMILES(简化分子线性输入规范),标记目标性质标签,通过训练阶段学习已知药物分子的特征,得到训练模型;通过重构阶段,利用训练模型重构分子;通过生成阶段,利用训练模型生成分子,这些生成的分子同时具备设定的多种目标性质,同时生成的分子中具有大量的新分子与新骨架。本发明可用于药物或化合物等多种分子的生成,通过一次训练即可学习已知药物的特征和性质,从而进行同时满足所需物理、化学和生物性质的分子生成。采用本发明生成的分子有效性更高,性质更为优异。

技术领域

本发明涉及计算机人工智能与全新分子设计的交叉技术领域,尤其涉及一种多任务胶囊自编码器神经网络的全新分子生成方法,是一种基于自编码器框架和多任务胶囊分类器框架进行全新分子设计的方法,适用于生成同时符合多种物理、化学和生物性质的分子。

背景技术

小分子药物设计方法在活性药物研发过程中起关键作用。传统药物设计方法如虚拟筛选和药效团模型主要用于对已知虚拟化合物库进行搜索。由于化学空间中潜在可合成分子数目庞大(1023-1060)以及当前计算机计算性能的限制,对整个化学空间进行全局搜索较难,对搜索结果的分析和处理需要大量的专业经验。人工智能技术作为一种数据驱动的计算方法,可以从数据集中自动学习药物分子的化学结构和构效关系等知识,帮助科学家设计具有目标性质的分子,为药物发现和开发带来希望。基于深度神经网络的从头分子设计方法作为一种新型人工智能技术,可用于生成具有所需性质的分子。具有无须枚举虚拟化合物库即可生成具有优化性质的新分子的优势。但是现有分子生成方法仅考虑一种目标性质分子的生成,难以学习除该性质以外的其它特征,不能对分子多种性质进行同时优化,影响最终生成的效果,无法满足新药分子设计的要求。在分子生成的过程中,一个关键的难点在于分类器的选择,常用的支持向量机无法直接与深度神经网络联合训练,卷积神经网络分类效果不好,难以应用于多种目标性质的分子分类和生成。

发明内容

本发明的目的在于提出一种生成能同时满足分子量、脂水分配系数、氢键供体、氢键受体、可旋转键数量、极性表面积、可合成性和特定靶标活性等多种目标性质分子的方法。

本发明提出了一种新的模型,以自编码器作为基本框架,在隐藏层整和一个多任务胶囊分类器。采用本方法可有效生成多种目标性质优化的药物分子。

本方法的技术方案是:

一种基于多任务胶囊自编码器神经网络的全新分子生成方法,其特征在于:将药物分子表示为SMILES(简化分子线性输入规范),标记分子的目标性质标签。在结构上,该模型包括编码器、多任务胶囊分类器和解码器三个部分。编码器利用双向长短期记忆网络将药物分子SMILES编码为固定长度的向量;多任务胶囊分类器利用双层胶囊层编码表征药物分子性质标签的向量;解码器利用基于长短期记忆网络直接对隐藏层向量进行解码,生成分子的SMILES,实现分子的重构或全新分子的生成。

包括以下步骤:

步骤1:收集训练数据,提取分子SMILES独热(one-hot)编码表,计算性质标签;

步骤2:通过训练阶段学习已知药物分子SMILES的特征,得到训练模型;

步骤3:通过重构阶段,利用训练模型重构分子;

步骤4:通过生成阶段,利用训练模型生成特定性质分子。

进一步地,所述步骤1具体包括:

收集药物分子,建立特定的训练数据集;

采用SMILES表示药物分子;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011247808.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top