[发明专利]药物分子筛选方法及系统在审
申请号: | 202010912085.6 | 申请日: | 2020-09-02 |
公开(公告)号: | CN112071373A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 汪念;吴楚楠;徐旻;温书豪;马健;赖力鹏 | 申请(专利权)人: | 深圳晶泰科技有限公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 分子 筛选 方法 系统 | ||
1.一种药物分子筛选方法,其特征在于,包括:
预处理:采集与特定疾病相关药物分子数据,对数据进行预处理,计算其编码向量及相关的药物理化性质,形成结构数据并存入数据库;
构建训练模型:构建和训练基于条件变分自编码器的AI模型,将编码向量和分子的药物理化性质组合作为模型的输入层,通过模型的编码层转换为隐层编码向量,再经模型的解码层生成可能的药物分子结构,在模型训练过程中,通过梯度下降算法将模型损失函数最小化,不断更新迭代编码层和解码层的神经网络结构的权值参数;
生成潜在药物分子:根据训练出的条件变分自编码器的模型,生成治愈特定疾病的潜在药物分子。
2.根据权利要求1所述的药物分子筛选方法,其特征在于,所述编码向量为SMILES式编码向量,所述预处理包括:统计出SMILES式中所有字符,将SMILES式中每个字符都转换为one-hot向量,将每个药物分子的SMILES式数据处理为设定维度的编码向量。
3.根据权利要求1所述的药物分子筛选方法,其特征在于,所述计算药物分子的药物理化性质包括:计算分子质量、计算脂水分配系数、计算分子H键供体数、计算分子H键受体数、计算分子拓扑极性表面积中的一种或多种。
4.根据权利要求3所述的药物分子筛选方法,其特征在于,将计算分子质量、计算脂水分配系数、计算分子拓扑极性表面积三个指标的数据进行归一化处理,将数据统一映射到-1.0-1.0范围内,将每个药物分子的5个药物理化性质形成5维向量。
5.根据权利要求2所述的药物分子筛选方法,其特征在于,将SMILES式数据和药物理化性质数据共同组成药物分子总数据集并按照4:1的比例将总数据集随机划分为训练数据集和测试数据集,将每个SMILES式数据处理为一个120维编码向量,和5个代表不同药物理化性质的向量拼接组合形成一个125维向量数据,并作为模型的输入层。
6.根据权利要求1至5任意一项所述的药物分子筛选方法,其特征在于,所述AI模型结构包括:输入层、编码层、隐层、解码层、输出层,所述编码层输入输入层输出数据,输出到隐层,所述编码层为RNN网络结构,包含3层循环神经网络层,采用LSTM单元,每一层设置512个隐藏节点,所述解码层输入隐层的输出数据,输出到输出层,所述解码层为RNN网络结构,包含3层循环神经网络层,采用LSTM单元,每一层设置512个隐藏节点,在解码层后还存在softmax层,其代价函数采用交叉熵函数
,其中,K为种类数量 ,y是标签,p是网络的输出,指类别是i的概率;通过softmax层,估计出SMILES式编码向量中每一位具体某个字符类别的概率分布,最终通过数据预处理中one-hot值与具体编码字符直接的对应关系,重构出输出样本,输出SMILES式。
7.根据权利要求6所述的药物分子筛选方法,其特征在于,所述输入层经过编码层生成隐层形成编码器,隐层经过解码层生成输出层形成解码器,所述编码器将高维输入转化为低维的隐向量,所述损失函数,该损失函数包括两部分,第一部分表示使用概率分布P(X’|z,c)下P(X)的对数似然,表征编码层的输出与输入训练样本X的距离;第二部分为KL散度,表示Q(z|X,c)与其参考概率分布N(0,1)之间的距离。
8.根据权利要求1至5任意一项所述的药物分子筛选方法,其特征在于, 根据模型结构,基于tensorflow进行模型的构建与训练,训练过程中使用训练数据集进行模型训练,同时使用测试数据集计算测试集误差即损失函数,防止模型过拟合,在一定的训练轮次epoch之后,对比训练数据集误差和测试数据集误差,当测试数据集误差基本不变,训练数据集误差下降变化减弱,模型的编码层和解码层参数被优化到最佳数值,停止训练并保存模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳晶泰科技有限公司,未经深圳晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010912085.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:玻璃基材真空磁控溅射镀铜方法
- 下一篇:线控制动系统及车辆