[发明专利]药物分子筛选方法及系统在审

专利信息
申请号: 202010912085.6 申请日: 2020-09-02
公开(公告)号: CN112071373A 公开(公告)日: 2020-12-11
发明(设计)人: 汪念;吴楚楠;徐旻;温书豪;马健;赖力鹏 申请(专利权)人: 深圳晶泰科技有限公司
主分类号: G16C20/70 分类号: G16C20/70;G06N3/04;G06N3/08
代理公司: 深圳市科吉华烽知识产权事务所(普通合伙) 44248 代理人: 胡吉科
地址: 518000 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 药物 分子 筛选 方法 系统
【权利要求书】:

1.一种药物分子筛选方法,其特征在于,包括:

预处理:采集与特定疾病相关药物分子数据,对数据进行预处理,计算其编码向量及相关的药物理化性质,形成结构数据并存入数据库;

构建训练模型:构建和训练基于条件变分自编码器的AI模型,将编码向量和分子的药物理化性质组合作为模型的输入层,通过模型的编码层转换为隐层编码向量,再经模型的解码层生成可能的药物分子结构,在模型训练过程中,通过梯度下降算法将模型损失函数最小化,不断更新迭代编码层和解码层的神经网络结构的权值参数;

生成潜在药物分子:根据训练出的条件变分自编码器的模型,生成治愈特定疾病的潜在药物分子。

2.根据权利要求1所述的药物分子筛选方法,其特征在于,所述编码向量为SMILES式编码向量,所述预处理包括:统计出SMILES式中所有字符,将SMILES式中每个字符都转换为one-hot向量,将每个药物分子的SMILES式数据处理为设定维度的编码向量。

3.根据权利要求1所述的药物分子筛选方法,其特征在于,所述计算药物分子的药物理化性质包括:计算分子质量、计算脂水分配系数、计算分子H键供体数、计算分子H键受体数、计算分子拓扑极性表面积中的一种或多种。

4.根据权利要求3所述的药物分子筛选方法,其特征在于,将计算分子质量、计算脂水分配系数、计算分子拓扑极性表面积三个指标的数据进行归一化处理,将数据统一映射到-1.0-1.0范围内,将每个药物分子的5个药物理化性质形成5维向量。

5.根据权利要求2所述的药物分子筛选方法,其特征在于,将SMILES式数据和药物理化性质数据共同组成药物分子总数据集并按照4:1的比例将总数据集随机划分为训练数据集和测试数据集,将每个SMILES式数据处理为一个120维编码向量,和5个代表不同药物理化性质的向量拼接组合形成一个125维向量数据,并作为模型的输入层。

6.根据权利要求1至5任意一项所述的药物分子筛选方法,其特征在于,所述AI模型结构包括:输入层、编码层、隐层、解码层、输出层,所述编码层输入输入层输出数据,输出到隐层,所述编码层为RNN网络结构,包含3层循环神经网络层,采用LSTM单元,每一层设置512个隐藏节点,所述解码层输入隐层的输出数据,输出到输出层,所述解码层为RNN网络结构,包含3层循环神经网络层,采用LSTM单元,每一层设置512个隐藏节点,在解码层后还存在softmax层,其代价函数采用交叉熵函数

,其中,K为种类数量 ,y是标签,p是网络的输出,指类别是i的概率;通过softmax层,估计出SMILES式编码向量中每一位具体某个字符类别的概率分布,最终通过数据预处理中one-hot值与具体编码字符直接的对应关系,重构出输出样本,输出SMILES式。

7.根据权利要求6所述的药物分子筛选方法,其特征在于,所述输入层经过编码层生成隐层形成编码器,隐层经过解码层生成输出层形成解码器,所述编码器将高维输入转化为低维的隐向量,所述损失函数,该损失函数包括两部分,第一部分表示使用概率分布P(X’|z,c)下P(X)的对数似然,表征编码层的输出与输入训练样本X的距离;第二部分为KL散度,表示Q(z|X,c)与其参考概率分布N(0,1)之间的距离。

8.根据权利要求1至5任意一项所述的药物分子筛选方法,其特征在于, 根据模型结构,基于tensorflow进行模型的构建与训练,训练过程中使用训练数据集进行模型训练,同时使用测试数据集计算测试集误差即损失函数,防止模型过拟合,在一定的训练轮次epoch之后,对比训练数据集误差和测试数据集误差,当测试数据集误差基本不变,训练数据集误差下降变化减弱,模型的编码层和解码层参数被优化到最佳数值,停止训练并保存模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳晶泰科技有限公司,未经深圳晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010912085.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top