[发明专利]一种确定smiles表达式之间是否具有子结构关系的方法有效
申请号: | 201610330605.6 | 申请日: | 2016-05-18 |
公开(公告)号: | CN106021474B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 顾进广;彭彬;黄智生;范玉玲;杨毅融 | 申请(专利权)人: | 武汉科技大学;厦门中坤化学有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种确定smiles表达式之间是否具有子结构关系的方法,包括:定义并存储常见原子、化学键和支链关系;定义切片最小粒度:相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;定义起始原子和终止原子,其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系。本发明方法可用于化学式部分结构检索,方法简单,执行效率高。 | ||
搜索关键词: | 一种 确定 smiles 表达式 之间 是否 具有 结构 关系 方法 | ||
【主权项】:
1.一种确定smiles表达式之间是否具有子结构关系的方法,其特征在于,包括以下步骤:步骤1:定义并存储常见原子、常见化学键和常见支链关系;步骤2:定义切片最小粒度;相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;步骤3:定义起始原子和终止原子;其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;步骤4:基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;其中所述原子对根据相邻原子与之间的化学键关系与主支链关系确定;所述将smiles表达式切割成一个个原子对,具体实现包括以下子步骤:步骤4.1、首先对那些存储异构smiles的字符串剔除异构字符;步骤4.2、统计环的个数与环边拆分位置的原子对;步骤4.3、对经过预处理与去环结构后的smiles字符串进行循环遍历,判断ch[stop]的值情况,其中ch[stop]代表遍历字符串时,下标所处位置对应的字符值;若为“=”,则化学键=“=”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;若为“#”,则化学键=“#”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;若为“(”,该位置前的第一个原子也就是起始原子与左括号内的内容,组成新的字符串,设置为str1;起始原子与对应右括号后的内容,组成新的字符串,设置为str2;将str1,str2作为新的smiles表达式进行切片流程处理;若为“)”, 位置指针向左寻找,找到与该括号匹配的左括号位置,并将左括号左边的第一个原子作为起始原子,位置为起始位置;若为其他字符,则化学键=“”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;步骤4.4、根据公式:原子对=起始原子+化学键+终止原子;得到原子对,并存储到哈希表map中;步骤4.5、将此次切片结果存储到哈希表map中,key值为片段名,value存储为该片段的个数;切片结果展示的是smiles结构式切成片段的种类与个数;步骤5:对化学式切片结果,根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系;具体实现包括以下子步骤:步骤5.1:将两个待匹配的smiles表达式进行切片处理,待匹配的smiles表达式切片结果记为A,被匹配的smiles表达式结果切片结果记为B;步骤5.2:判断,A环的个数是否大于B环的个数;若是,则不具有子结构关系,本流程结束;若否,则继续执行下述步骤5.3;步骤5.3:判断,A的种类是否大于B的种类;若是,则不具有子结构关系,本流程结束;若否,则继续执行下述步骤5.4;步骤5.4:判断,A每种种类的个数是否大于B对应种类的个数;若是,则不具有子结构关系,本流程结束;若否,则具有子结构关系,本流程结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学;厦门中坤化学有限公司,未经武汉科技大学;厦门中坤化学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610330605.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种多元属性电影数据可视化系统
- 下一篇:一种电磁环境测量数据清洗方法