[发明专利]一种化学分子式拼接方法有效
申请号: | 201910646187.5 | 申请日: | 2019-07-17 |
公开(公告)号: | CN110390997B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 金霞;韩瑞峰 | 申请(专利权)人: | 成都火石创造科技有限公司 |
主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/50 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 610200 四川省成都市天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 化学 分子式 拼接 方法 | ||
1.一种化学分子式拼接方法,其特征在于,用于对两个带位点的化学分子式smi1和smi2进行拼接,将分子式中要拼接的位置即位点记为[Ri],i=0,1…N,[Ri]对应于某一反应类型,N为反应类型的总数,拼接过程如下:
(1)读入化学分子式smi1和smi2,分别转换为表示分子的图数据结构mol1和mol2;读入时对位点[Ri]标记进行特殊处理:记录它在分子中的原子序号IDX和反应类型标号i,并定义一个重金属映射表,将每个位点[Ri]映射到一个不会在拼接前和拼接后的分子式中出现的重金属原子;将原子序号IDX、反应类型标号i和分子式中所有[Ri]映射后的重金属原子分别保存到mol1和mol2的数据结构中;
(2)将mol2与mol1的数据结构相加,即把两者的原子、化学键、化学键属性信息堆叠,得到mol3,即将mol2中原子的原子序号IDX加上mol1的原子数,包括mol2中的[Ri]的原子序号IDX,形成拼接的初步结果mol3;
(3)在mol3中找到相同标号i的位点对记为p,q,分别找到它们相连的原子ATOMp和ATOMq,在ATOMp和ATOMq之间新增一个原子键,将ATOMp和ATOMq相连,并将p,q删除,同时删除与p,q相连的化学键,实现smi1和smi2的拼接;
(4)返回步骤3,在剩余的原子中寻找相同标号i的位点对,直到没有匹配的位点对;
(5)将mol3转换为Canonical SMILES格式的分子式smi3,查询步骤1中定义的重金属映射表,如果smi3中有该表中的重金属原子,将它替换为对应的[Ri]。
2.根据权利要求1所述的一种化学分子式拼接方法,其特征在于,所述步骤(1)中,读入的分子式格式为Canonical SMILES,其他格式的输入需要转换为该格式。
3.根据权利要求1所述的一种化学分子式拼接方法,其特征在于,所述步骤(1)中,图数据结构为原子与化学键连成的图,其中包含分子中的原子、化学键、化学键属性信息。
4.根据权利要求1所述的一种化学分子式拼接方法,其特征在于,所述步骤(4)中,在剩余的原子中寻找相同标号i的位点对,直到没有匹配的位点对,此时mol3数据结构中的原子都是相连的,没有独立的原子,如果有则人工查验。
5.根据权利要求1所述的一种化学分子式拼接方法,其特征在于,所述步骤(5)中,有重金属说明有未拼接的位点,还需要跟其他带有相同位点的分子进行拼接,以形成最终的分子化合物。
6.根据权利要求1所述的一种化学分子式拼接方法,其特征在于,对于拼接后得到新的环或双键结构,需要在mol3中更新对应的键信息,再输出为Canonical SMILES格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都火石创造科技有限公司,未经成都火石创造科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910646187.5/1.html,转载请声明来源钻瓜专利网。