[发明专利]一种基于SMILES的定量构效方法和装置在审
申请号: | 201811516668.6 | 申请日: | 2018-12-12 |
公开(公告)号: | CN111312340A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 黄辉;汪念 | 申请(专利权)人: | 深圳市云网拜特科技有限公司 |
主分类号: | G16C20/30 | 分类号: | G16C20/30 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 李琴 |
地址: | 518000 广东省深圳市南山区沙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 smiles 定量 方法 装置 | ||
本发明公开了一种基于SMILES的定量构效方法和装置。所述方法包括:通过将化学分子规范表达所需的SMILES字符串转化为相应的One‑Hot数字编码,并采用Embedding层对One‑Hot数字编码进行降维处理;将降维处理后的One‑Hot数字编码按次序输入多层双向GRU层,并采用多层双向GRU层来学习SMILES字符串的前后关联特征;采用全连接层对学习到的SMILES字符串的前后关联特征进行非线性组合,完成化学分子属性预测模型的训练。本发明提供的定量构效方法是基于SMILES来形成化学分子属性预测模型的,避免预测结果受人为因素影响,使得化学分子属性预测模型的预测结果更加准确可靠。
技术领域
本发明涉及定量构效技术领域,特别涉及一种基于SMILES的定量构效方法和装置。
背景技术
简化分子线性输入规范(Simplified Molecular Input Line EntrySpecification,简称“SMILES”)字符串是一种用ASCII字符串明确描述分子结构的规范,可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。因SMILES字符串的适用性强,可作为输入可以处理绝大部分分子数据。
定量构效方法(Quantitative Structure-Activity Relationship,简称“QSAR”)是计算机辅助药物分子设计应用最为广泛的药物设计方法,其是将化合物的结构信息、理化参数与生物活性进行分析计算,建立合理的数学模型,研究结构和活性之间的量变规律,可以预测化合物的生理活性或某些性质,为药物设计、先导化合物结构改造提供理论依据。
现代计算机辅助小分子药物发现和开发中,传统学习方法被广泛用于构建预测模型。传统的QSAR方法广义上可以延伸成传统的机器学习,但是各种模型中含有人为设计的分子标识符,因此预测结果是受人为因素影响的,准确度不高,而且需要构造出对应的模型环境进行计算。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种基于SMILES的定量构效方法和装置。所述技术方案如下:
一方面,本发明实施例提供了一种基于SMILES的定量构效方法,所述方法包括:
构建化学分子属性预测模型,所述化学分子属性预测模型包括:Embedding层、多层双向门控循环单元(Gated Recurrent Unit,简称“GRU”)层、以及全连接层;
将化学分子规范表达所需的SMILES字符串转化为相应的One-Hot数字编码,并采用Embedding层对One-Hot数字编码进行降维处理;
将降维处理后的One-Hot数字编码按次序输入多层双向GRU层,并采用多层双向GRU层来学习SMILES字符串的前后关联特征;
采用全连接层对学习到的SMILES字符串的前后关联特征进行非线性组合,完成化学分子属性预测模型的训练,并根据训练好的化学分子属性预测模型来预测化学分子的物理化学性质。
在本发明实施例上述的基于SMILES的定量构效方法中,多层双向GRU层中的每层双向GRU层均包括:正向GRU和反向GRU,
多层双向GRU层的输出为最后一层GRU层的正向GRU的最后一个时间步的输出和后向GRU的第一个时间步的输出的拼接;
多层双向GRU层的中间层的输入是其上一层双向GRU层同一个时间步的输出。
在本发明实施例上述的基于SMILES的定量构效方法中,所述将降维处理后的One-Hot数字编码按次序输入多层双向GRU层,并采用多层双向GRU层来学习SMILES字符串的前后关联特征,包括:
将降维处理后的One-Hot数字编码进行dropout技术处理,并将dropout技术处理后的数据作为多层双向GRU层中第一层双向GRU层的输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市云网拜特科技有限公司,未经深圳市云网拜特科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811516668.6/2.html,转载请声明来源钻瓜专利网。