[发明专利]可解释的分子生成模型在审
申请号: | 202111430254.3 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114627983A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | S.塔克达 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/50;G06N3/08;G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可解释 分子 生成 模型 | ||
可以提供一种用于训练具有可解释的隐空间的分子生成模型以标识来自从具有目标性质的输入分子生成的隐空间的生成的分子生成的子结构的方法。可以利用具有相关联的性质和已知子结构的分子结构的数据集来训练分子生成模型。该模型可以生成隐空间,在该隐空间中,子结构预测器模型可以被进一步训练以从具有目标性质和标识的子结构的输入分子预测具有目标性质的分子的子结构的数量。
技术领域
本发明一般涉及分子结构生成模型的领域,并且更具体地涉及在由分子生成模型生成的分子结构中的子结构标识。
背景技术
设计新的化合物可能是劳动密集型和昂贵的过程。在许多情况下,确定新化合物是否可以用于预期目的是通过反复试验来确定的。化学家或化学工程师进行湿法实验的进展是有限的,并且测试出每种可能的化合物是不切实际的。在许多工业中,包括汽车、制药、航空、半导体和农业中,需要具有已知性质的化合物的更快速开发。目前,存在具有拥有物理和化学性质的分子结构的库可用于研究。生成模型可以帮助研究者缩小对具有期望性质的分子结构的搜索范围。机器学习技术已经允许越来越大量的数据被分析和处理,包括分子结构的数据库。
发明内容
本公开的实施例包括用于训练分子生成模型的计算机实现的方法、计算机程序产品和系统。实施例包括用分子结构的数据集训练机器学习模型,以基于具有目标性质的输入分子结构生成具有目标性质的输出分子结构。此外,实施例包括从分子结构的数据集生成隐空间。另外,实施例包括训练子结构预测模型以基于生成的输入分子结构的隐空间来预测具有目标性质的输出分子结构的一个或多个子结构。
本公开还提供了用于生成具有目标性质和与目标性质相关联的生成的分子的预测子结构的数量的候选分子的实施例。实施例包括利用分子生成模型生成输入分子的隐空间。此外,实施例包括利用子结构预测模型来预测具有一个或多个目标性质的输出分子的一个或多个子结构,子结构预测模型被训练以基于输入分子从由分子生成模型生成的隐空间预测一个或多个子结构。
上述发明内容并非旨在描述本公开的每个实施方式的每个所示实施例。
附图说明
图1是根据本发明的实施例的一般可解释的分子结构生成模型环境的功能框图。
图2是描绘根据本发明的实施例的分子生成引擎的功能框图。
图3是描绘根据本发明的实施例的用于训练可解释的分子生成模型和子结构预测模型以预测由分子生成模型生成的分子结构的子结构的方法的流程图。
图4是描绘预测生成的分子结构内的子结构数量的方法的流程图。
图5是根据本发明的实施例的可解释的分子结构生成模型环境内的示例性计算系统的功能框图。
图6是描绘根据本发明的实施例的云计算环境的图。
图7是描绘根据本发明的实施例的抽象模型层的功能框图。
虽然本文所述的实施例可具有各种修改和替代形式,但其细节已在附图中以实例的方式示出并将详细描述。然而,应当理解,所描述的特定实施例不应被理解为限制性的。相反,本发明将涵盖落入本公开的精神和范围内的所有修改、等效物和替代方案。
具体实施方式
所描绘的实施例允许可解释的分子结构生成模型,更具体地,允许训练机器学习模型以基于输入分子生成具有目标性质的候选分子结构,并预测与候选分子结构相关联的性质。此外,实施例提供了一种用于联合训练机器学习模型以解释分子生成模型的隐空间(latent space)从而预测候选分子结构中与目标性质相关联的子结构的数量的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111430254.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于控制对数据的访问的安全智能容器
- 下一篇:标识语音命令边界