[发明专利]基于自助抽样法的谱图搜库结果统计验证方法在审
申请号: | 201710959390.9 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107798342A | 公开(公告)日: | 2018-03-13 |
发明(设计)人: | 余绍宁 | 申请(专利权)人: | 浙江和谱生物科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州知通专利代理事务所(普通合伙)33221 | 代理人: | 朱林军 |
地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自助 抽样 谱图搜库 结果 统计 验证 方法 | ||
技术领域
本发明涉及一种用于谱图搜库匹配结果的统计验证方法。
背景技术
谱图的匹配比对在生物医学、化学、物理学等领域中有着广泛的应用。
在血液细菌感染(菌血症)的细菌鉴定工作中,由于患者的临床表现不典型,给感染的诊断带来困难。目前,临床上菌血症诊断的金标准是血液细菌培养法,但血液培养的阳性率极低从而导致延误治疗。相比之下,质谱谱图法准确度高、稳定性好、操作简单,易于临床推广。从1990年代起,基质辅助激光解析电离源飞行时间质谱(MALDI-TOF-MS)被用于细菌鉴定[R.D.Holland,J.G.Wilkes, F.Rafii,J.B.Sutherland,C.C.Persons,K.J.Voorhees,J.O.Lay,Rapid Communications in Mass Spectrometry 1996,10,1227-1232;M.A.Claydon,S.N. Davey,V.EdwardsJones,D.B.Gordon,Nature Biotechnology 1996,14, 1584-1586.]。通过分析不同的细菌,科学家发现从完整的细菌细胞中可以得到具有指纹特征性的质谱图。通过记录多种单一纯细菌的指纹质谱图可以构建细菌鉴定所需的生物特征数据库。之后通过比对临床样本中采集的细菌的 MALDI-TOF-MS指纹质谱图,可以实现细菌种类的鉴定[A.Croxatto,G.Prod'hom, G.Greub,Fems Microbiology Reviews 2012,36,380-407;T.R.Sandrin,J.E. Goldstein,S.Schumaker,Mass Spectrometry Reviews 2013,32,188-217.]
谱图匹配也广泛用于蛋白质测序工作。肽段质量指纹谱图(peptide mass fingerprint)匹配法用于蛋白酶解产物的质谱分析,根据数据库中已有蛋白的序列及酶解反应特征可以生成单个蛋白的理论肽段列表暨理论标准谱图,通过比对实验谱图可以实现未知蛋白的鉴定。[Webster J,Oxley D,Methods Mol Biol 2005,310,227-240.]蛋白质组学中常使用的“鸟枪法”(shotgun)也是依赖于质谱图的匹配完成的,如基于二级碎片质谱图的肽谱匹配打分和蛋白质鉴定。 [Fernández-Puente P,Mateos J,Blanco FJ,Ruiz-Romero C,Methods Mol Biol 2014, 1156,27-38.]质谱匹配已经成为当今蛋白质鉴定中至关重要的技术手段。
基于谱学方法的检测、鉴定中最为关键的一步是实验样本和参考样本的谱图匹配。近年来发展了多种用于谱图匹配的打分方法。Seongho Kim和Xiang Zhang研究了质谱图相似性打分的夹角余弦法、皮尔森和斯皮尔曼相关系数法、偏相关与部分相关系数法。[S.Kim,X.Zhang,Computational&Mathematical Methods in Medicine 2013,9,399-412]
然而传统的谱图匹配方法往往基于最优的谱图相似性计算结果,及一个给定的分值阈值,缺乏统计验证。譬如,在临床微生物鉴定普遍使用的质谱法中, Bruker公司提供的商业解决方案Biotyper软件以2.0的相似度分值为鉴定阈值,然而该阈值的合理性有待考量。[Schulthess,B.;Bloemberg,G.V.;Zbinden,R.; Bottger,E.C.;Hombach,M.J.Clin.Microbiol.2014,52,1089-1097.]
发明内容
本发明针对现有的谱图匹配方法缺乏统计验证的问题,旨在建立一种基于自助抽样法的谱图搜库结果统计验证方法,以反映鉴定结果可信度的统计分值替代相似度分值作为准确鉴定的标准。
本发明的技术方案是:
一种基于自助抽样法的谱图搜库结果统计验证方法,它包括以下步骤:
(1)利用自助抽样法模拟生成一系列谱图。
对于一张包含N个谱峰的样品谱图,有放回的随机抽取N次,每次抽取1 个谱峰;将抽取的N个谱峰组成一张新谱图;反复进行抽取,得到大量(≥100) 新谱图。
(2)计算反映样品搜库结果可信度的统计分值(Conf)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江和谱生物科技有限公司,未经浙江和谱生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710959390.9/2.html,转载请声明来源钻瓜专利网。