[发明专利]化学物质的信息的处理和匹配方法、系统及存储系统无效
申请号: | 201010299057.8 | 申请日: | 2010-09-29 |
公开(公告)号: | CN102436447A | 公开(公告)日: | 2012-05-02 |
发明(设计)人: | 吴贤;张俐;郭宏蕾;蔡柯柯;苏中 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 鲍进 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 化学物质 信息 处理 匹配 方法 系统 存储系统 | ||
技术领域
本公开涉及化学信息处理技术,尤其是,涉及存储和匹配化学物质的信息的方法和系统及存储系统。
背景技术
众所周知,在化学领域中术语是相当复杂且不一致的。以化学名称为例,存在以下多种不兼容命名法:
·IUPAC命名系统:一种有系统地命名化合物的方法。该命名法用一个确定的名称来描述每一种有清楚的结构式的化合物,便于研究人员可以没有歧义的进行交流。同时,IUPAC命名系统也接受一些物质和基团的惯用普通命名。
·SMILES命名系统:一种用于使用短的ASCII字符串来无歧义地描述化学分子的结构的规范。SMILES串可以被大多数分子编辑器导入以转换回到分子的2维图或3维图。
·IUPAC国际化学标识符(InChi)命名系统:和SMILES类似,也是一种用于表示化学物质结构的文本标识符。Inchi既是可读的,也可以用来建立结构索引数据库。
·CAS注册号(CAS Registry Number或称CAS Number,CASRn,CAS#):它是有机化合物、无机化合物、金属、合金、元素、蛋白质与核酸、聚合物等的唯一数字标识符。
在上述命名系统中,SMILES和INCHI着重于表示化学结构,而IUPAC提供抽象表示,CAS编号使用数字编码而没有任何语义含义。
其次,除了不同的化学名称命名法则,在同一种命名方式下,化学名称的同名(也称为“同义词”)非常普遍。根据的统计,对于药物Valium(安定),DrugBank给出了117个同义词,其中包括Clobazam(氯巴占)、Alboral、Duxen、Paceum、Solis等等。
在过去几十年里,信息技术的快速发展已经实现了信息技术在化学信息处理领域中的应用。例如,在现有技术中,有的技术通过分析化学物质INCHI名称,建立索引,实现化学名称的检索;有的技术从IUPAC化学名称中抽取出最频繁出现的子字符串作为索引,获得具有该子字符串的所有化学名称;另外还有的系统提供了绘制化学结构式的工具,用户可以利用该工具将绘制出部分结构作为查询条件,然后提交到搜索系统进行化学结构相似度的搜索。此外,这些技术并没有从功能的角度去分析化学结构,因此不能从功能的角度获得某一化学物质同一命名方法命名下的同义词,更不用说使用其它命名方法命名的同义词。
发明内容
由上述可知,现有技术中存在以下缺陷:第一,仅仅使用一种命名法来进行查询,这种查询往往要求完全匹配,从而难以搜索到用其它命名法命名的同一种物质;第二,这些技术难以搜索具有相同或相似功能但具有不同名称的化学物质;第三,虽然已经有一些基于结构相似度的匹配方法,但由于化学结构非常复杂,简单的应用结构匹配并不能找出具有相同或相似功效的匹配。也就是说,使用现有的信息技术在化学信息处理领域里仍然不能够基于一种化学物质的任一特定命名或结构式获得该化学名称的全部同义词。
因此,现有技术中需要一种独立于命名方法而处理和/或匹配化学物质的信息的方法和系统及其存储系统。
考虑到现有技术中存在的上述问题,本公开的一个方面提供了一种利用特征子结构高效全面地索引和/或查询化学物质的信息的方法和系统及其存储系统。
根据本公开的一个实施例提供了一种将化学结构式用于化学信息处理的方法和系统。在这种化学信息处理系统中使用化学物质的有功能区分度的化学子结构,而不是化学名称或者普通的根据频率抽取出的子结构,作为索引和检索的基本单元。在此情况下,本公开的一个实施例解决了在化学领域中遇到的多种命名法和对同义词进行分组的问题。更具体而言,本公开的一个实施例可以独立于使用任一具体命名方法的命名而获得具有相同或相似功能的化学物质的信息。
本发明的实施例可以以包括方法或系统的多种方式实施。下面讨论本发明的几个实施例。
作为一种化学物质的信息的处理方法,本发明的一个实施例至少包括下列操作:获得所述化学物质的化学结构式的子结构;从所获得的子结构中确定所述化学物质的特征子结构;以及存储所述化学物质的所述特征子结构。
作为一种化学物质的信息的查询方法,本发明的一个实施例至少包括:获得化学物质的查询请求;以及获得所要查询的化学物质的特征子结构。
作为一种用于相关联地存储化学物质与特征子结构的存储系统,本发明的一个实施例至少包括:接口装置,用于响应于外部请求,传送所述化学物质的信息及其特征子结构;以及与所述接口装置耦接的存储装置,用于相关联地存储化学物质的信息及其特征子结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010299057.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有宁静区的接近警告系统
- 下一篇:一种砝码质量测量中的空气浮力修正装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置