[发明专利]可解释的分子生成模型在审
申请号: | 202111430254.3 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114627983A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | S.塔克达 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/50;G06N3/08;G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可解释 分子 生成 模型 | ||
1.一种用于训练分子生成模型的计算机实现的方法,所述方法包括:
由一个或多个处理器使用分子结构的数据集训练分子生成模型,以基于具有目标性质的输入分子结构生成具有目标性质的输出分子结构;
由一个或多个处理器从分子结构的数据集生成隐空间;以及
由一个或多个处理器训练子结构预测模型,以基于生成的输入分子结构的隐空间来预测具有目标性质的输出分子结构的一个或多个子结构。
2.根据权利要求1所述的计算机实现的方法,其中分子生成模型是变分自动编码器。
3.根据权利要求1所述的计算机实现的方法,其中用于分子生成模型内的输入分子结构、输出分子结构和分子结构的数据集的分子结构的语法是简单分子输入线输入。
4.根据权利要求1所述的计算机实现的方法,其中分子结构的数据集包括多个分子结构,其中每个分子结构具有性质数据和子结构数据。
5.根据权利要求1所述的计算机实现的方法,其中训练子结构预测模型来预测一个或多个子结构还包括:
由一个或多个处理器将隐空间内的局部隐单元的集合稀疏地分配给具有与来自分子结构数据集的分子结构相关联的多个子结构。
6.一种用于训练分子生成模型的系统,所述系统包括:
一个或多个计算机处理器;
指令,当指令由一个或多个计算机处理器执行时,执行根据权利要求1-5中任一项所述的方法。
7.一种计算机程序产品,包括可由处理器执行以使处理器执行权利要求1-5中任一项所述的方法的程序指令。
8.一种用于生成具有目标性质和与目标性质相关联的生成的分子的子结构的数量的分子的计算机实现的方法,所述方法包括:
由一个或多个处理器利用分子生成模型生成输入分子的隐空间;以及
由一个或多个处理器,利用子结构预测模型来预测具有一个或多个目标性质的输出分子的一个或多个子结构,子结构预测模型被训练以基于输入分子从由分子生成模型生成的隐空间预测一个或多个子结构。
9.根据权利要求8所述的计算机实现的方法,其中分子生成模型是神经网络。
10.根据权利要求9所述的计算机实现的方法,其中神经网络是自动编码器。
11.根据权利要求8所述的计算机实现的方法,其中子结构预测模型是解码神经网络。
12.根据权利要求8所述的计算机实现的方法,还包括:
由一个或多个处理器利用分子生成模型、利用分子生成模型生成具有至少一个目标性质的输出分子。
13.一种用于生成具有目标性质和与目标性质相关联的生成的分子的子结构的数量的分子的系统,所述系统包括:
一个或多个计算机处理器;
指令,当指令由所述处理器执行时,执行根据权利要求8-12中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111430254.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于控制对数据的访问的安全智能容器
- 下一篇:标识语音命令边界