[发明专利]用于图到序列模型方法的对抗性自动编码器架构在审
申请号: | 202180014982.8 | 申请日: | 2021-02-19 |
公开(公告)号: | CN115104105A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | A·扎沃若克夫;E·O·普丁;K·S·克彻托夫 | 申请(专利权)人: | 英矽智能科技有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06N3/04;G06N3/08;G06N7/00;G16C20/70;G16C20/80 |
代理公司: | 上海一平知识产权代理有限公司 31266 | 代理人: | 李夫玲;徐迅 |
地址: | 中国香港中环康*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 序列 模型 方法 对抗性 自动 编码器 架构 | ||
图到序列(G2S)架构被配置为使用对象的图数据来生成新对象的序列数据。该过程可以与可以表示为图数据和序列数据的对象类型一起使用。例如,这样的数据是分子数据,其中每个分子可以表示为分子图和SMILES。示例还包括图像到文本或/和图像到语音转换的深度学习中的热门任务。图像可以自然地表示为图,而文本和语音可以原生表示为序列。G2S架构可以包括图编码器和样本生成器,其在潜在空间中产生潜在数据,可以利用对象的属性来对这些潜在数据设置条件。潜在数据被输入到鉴别器中以获得真实或假的对象,并被输入到解码器中以生成新对象的序列数据。
相关申请的交叉引用
本专利申请要求于2020年2月19日提交的申请号为62/978,721的美国临时申请的优先权,其临时内容通过具体引用整体并入本文。
背景技术
技术领域
本公开涉及一种用于将化学品从一种格式转换为另一种格式(例如从图模型转换为序列模型)的方法的对抗性自动编码器架构。
相关技术描述
深度神经网络(DNN)是最近为复杂数据处理和人工智能(AI)而创建的计算机系统架构。DNN包括机器学习模型,该模型采用多个非线性计算单元的隐藏层来预测一组接收到的输入的输出。DNN可以出于各种目的以各种配置提供,并继续开发以提高性能和预测能力。
深度学习在其整个开发过程中已经被用于各种目的,例如从图片或其他功能生成文本。最近,DNN已被用于生物标志物的开发、药物发现和药物再利用。在某种程度上,正在使用计算机技术来代替或增强标准药物的发现,以抵消识别潜在药物并在潜在药物作为商业药物销售之前使其通过监管程序所花费的大量时间和成本。虽然标准药物发现流水线包括许多阶段,但找到一组可能改变特定蛋白质或信号通路活性的初始分子仍然是一个问题。
可以通过去除不显示显著前景的化合物来提高新药候选物的命中率。这些化合物可以在早期阶段使用机器学习模型被确定为不适合进行进一步研究,该机器学习模型可以用于估计化合物的性质并指导药物优化过程。机器学习可用于使用变分自动编码器、图卷积和图消息传递网络来学习分子的有用潜在表示。
人工神经网络(ANN)是一类机器学习(ML)模型,它基于生物神经元的概念,广泛应用于分类、回归、聚类和对象生成等各种人工智能任务。通常,单个人工神经元接受所谓的输入信号(例如,通常表示为N维真值向量),并输出输入乘以应用了一些线性或非线性函数(例如sigmoid或双曲正切)的神经元的可学习权重之和。通常,ANN包括大量的逐层组织的人工神经元。每个ANN都有输入层、隐藏层和输出层。DNN是具有一个或多个隐藏层的ANN。
由于ML中几乎所有任务都是根据优化问题制定的,因此每个DNN都有一定的训练和验证程序,这些程序基于反向传播算法。例如,在训练阶段进行二进制分类的情况下,针对训练样本(例如,可获得真实标签的样本)计算一些损失函数(例如,二进制交叉熵),然后将聚合误差反向传播到DNN输入层。这个过程通常重复多次,直到协议在模型上收敛。验证阶段训练的DNN预测看不见的对象的标签(例如,模型在训练期间看不到对象),并且计算一些质量度量来估计训练的DNN模型的功效。
在一些实例中,以更简单的形式和在低维空间中表示复杂的高维对象是有益的。因此,存在称为自动编码器(AE)的特定DNN。AE包括两个DNN:编码器和解码器。编码器将输入信号压缩到称为潜在表示的低维空间中。解码器采用输入对象的潜在表示,并返回重建的输入信号。AE的训练目标是最小化输入信号与重建信号之间的误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英矽智能科技有限公司,未经英矽智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180014982.8/2.html,转载请声明来源钻瓜专利网。