[发明专利]分子结构数据库的建立方法及搜索方法有效
申请号: | 201310754439.9 | 申请日: | 2013-12-31 |
公开(公告)号: | CN104750761B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 季晓峻;宋国梁 | 申请(专利权)人: | 上海致化化学科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海天辰知识产权代理事务所(特殊普通合伙) 31275 | 代理人: | 林彦之 |
地址: | 200434 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分子结构数据库的建立方法及搜索方法,该方法预先将大规模分子库划分为多个有内部树形关系的群组,在搜索时,首先将分子结构A与数据库中所有分子结构进行分子指纹计算,获得初步匹配结果;然后将分子结构A与该结果集中分子结构逐一进行严格的子结构匹配计算;若完成匹配,则将该匹配上的分子及其子树所有分子结构一并加入到返回列表中。本发明通过对大规模分子数据库的特殊的预处理,使搜索中的严格子结构匹配次数大大降低从而大大提高分子结构搜索的效率,对于提高网站的并发访问数量有巨大的意义。 | ||
搜索关键词: | 分子结构 搜索 匹配 分子结构数据库 子结构 预处理 分子数据库 并发访问 分子指纹 匹配计算 匹配结果 树形关系 分子库 群组 网站 子树 数据库 返回 | ||
【主权项】:
1.一种分子结构数据库的建立方法,其特征在于,其包括以下步骤:步骤S011,读取一个分子结构A,计算其分子指纹并与数据库中所有分子结构的分子指纹进行比较;其中,分子结构A与其他分子结构分子指纹的比较包括:将两个分子结构分子指纹字符串的每个对应字符位置进行比较,将相同字符位置相同字符的数量除以总字符数量,得到分子指纹的相似度;步骤S012,分子结构A与数据库中所有分子结构的分子指纹进行比较并筛选后,将分子指纹相似度大于或等于预设值的分子结构放入第一结果集;步骤S013,将分子结构A与第一结果集中所有分子结构逐一进行子结构匹配计算,其中,分子结构的子结构匹配计算包括:将分子结构和另一对比的分子结构进行严格的基于原子类型和键连类型的化学结构图匹配;步骤S0141,若分子结构A的化学结构图包含第一结果集中至少一个分子结构的化学结构图,即完成包含匹配,则将分子结构A分别存储于这些分子结构所在的群组中,并存储分子结构A与群组内其他分子结构的相互连接关系和树形关系;步骤S0142,若分子结构A的化学结构图被包含于第一结果集中至少一个群组的根节点分子结构的化学结构图,即完成隶属匹配,则将分子结构A作为这些群组的新根节点存储,并存储分子结构A与群组内其他分子结构的相互连接关系和树形关系;步骤S0143,若分子结构A与第一结果集中任一分子结构均不包含或被包含,则新建一个群组,并将该分子结构A存储于该新群组中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海致化化学科技有限公司,未经上海致化化学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310754439.9/,转载请声明来源钻瓜专利网。