[发明专利]一种适用于天然产物质谱数据解析的数据库构建方法在审
申请号: | 201510443268.7 | 申请日: | 2015-07-24 |
公开(公告)号: | CN105095448A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 范骁辉;姜毅;吴晓波;李美松 | 申请(专利权)人: | 浙江大远智慧制药工程技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 林宝堂;刘正君 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 天然 物质 数据 解析 数据库 构建 方法 | ||
技术领域
本发明涉及一种数据库技术领域,尤其是涉及一种适用于天然产物质谱数据解析的数据库构建方法。
背景技术
天然产物已经被证明是获取药效物质的一种重要来源。现在已经被FDA批准的药物中,有60%是来自于天然产物或都是天然产物相关的。像青蒿素和紫杉醇及其衍生物更是广为人所知。正是如此,人们对于天然产物的分析方法一直在不停地探索和改进之中。液相色谱-质谱联用技术是此领域最重要的技术之一。质谱中常用碰撞诱导裂解(Collision-induceddissociation,CID)把分析物裂解为较小的分子碎片,通过观察碎片的信息,我们能够得到有关裂解前的化合物结构信息。然而,这样往往会得到非常巨大的数据量。怎么对这些数据进行快速有效的解析成为了一个较大问题。现在的许多实验室依旧在依靠人工进行数据的逐个解析,解析速度慢成了基于质谱的天然产物分析的一个重要瓶颈。
在与天然产物质谱分析相似的另一个领域----基于质谱分析的代谢组学研究中,类似的问题也存在。而对此已经有一些方案提出来用于应对这类瓶颈。
建立标准化合物的质谱数据库是其中一种容易想到的途径。比如NIST标准化合物质谱数据库,在基于气质联用的代谢组学研究中起到了非常重要的作用。另外像一些公开的数据库,如MassBank,也收集了大量的基于液质联用的质谱数据,为科研人员提供了巨大的支持。然而,这类数据库的不足也是显而易见的,就是这类的库很难把所有化合物都纳入其中,事实上,被纳入的化合物只是所有已知化合物中极小的一部分。比如MassBank中,到2015年2月份为止已有41092个化合物进入库中,而同一时间,收入于PubChem数据库的化合物为6千万个左右,大部分的化合物没有收入于质谱数据库。
为了解决标准化合物质谱数据库的这个问题,已经有了许多尝试。通过化合物质谱裂解规律对一些化合物进行计算机模拟的裂解,以此来预测准确的碎片以及每一种碎片的相对丰度,是最早为人所考虑的。自从1965年DENDRAL计划启动以来,此类的方法也一直处于发展中。如今较为有名的是热电公司的MassFrontier。然而,包括MassFrontier在内基于裂解规律的计算机模拟工具均主要以在电子轰击离子源(EI)下所得到和归纳的规律作为准则,而在以电喷雾电离(ESI),大气压化学电离(APCI)等为代表的主要用来分析天然产物的各种软电离方法下,上面的这些规律并没有表现得预想的那样准确。
近年来,一类较新的计算机辅助质谱数据解析方法不断地产生。以MetFrag为代表的一类组合裂解方法(combinatorialfragmentation)被提了出来。这类方法均以一定的方式遍历对象所有可能的碎片,对这类碎片生成的合理性用一定的方法进行评价,进而对所查询的质谱数据进行碎片的自动化归属。然而这类方法的准确性并不是很高,尤其是在天然产物这个领域。
前人对天然产物的质谱分析从开始到现在已经积累了大量的数据,归纳了大量的在ESI,APCI中切实能观察到的裂解规律,这些宝贵的资源并没有被好好地应用起来,所有的数据和裂解规律均散落在大量的文献报道中,难以方便地应用。
发明内容
本发明主要是解决现有技术中化合物依靠人工进行数据逐个解析,解析速度慢,现有的一些数据库建立后准确性并不是很高,以及数据和裂解规律均散落在大量的文献报道中,难以方便地应用的问题,提供了一种适用于天然产物质谱数据解析的数据库构建方法。
本发明的上述技术问题主要是通过下述技术方案得以解决的:一种适用于天然产物质谱数据解析的数据库构建方法,包括以下步骤:
S1.从化合物数据库上进行搜索获取与选定的天然产物骨架相关的所有化合物,并记录化合物相关信息;选定为预先设定好,操作人员根据选定名单对化合物进行搜索。化合物存储形式为SMILES形式。
S2.基于裂解规律对化合物进行计算机模拟裂解,获得该化合物的裂解碎片,记录化合物碎片相关信息;
S3.根据化合物碎片以及化合物的相关信息建立起数据库,并将数据库与网络平台相接。数据库建立可以使用当下的各种系统,包括Oracle,mysql,splite或microsoftsqlserver等。裂解所得的化合物碎片仍采用SMILES形式进行保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大远智慧制药工程技术有限公司,未经浙江大远智慧制药工程技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510443268.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置