[发明专利]蛋白质组学串联质谱图寻峰算法在审
申请号: | 202210953144.3 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115359847A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 何情祖;黎玉林;郭欢;帅建伟 | 申请(专利权)人: | 国科温州研究院(温州生物材料与工程研究所) |
主分类号: | G16B40/10 | 分类号: | G16B40/10;G16B20/00 |
代理公司: | 温州金瓯专利事务所(普通合伙) 33237 | 代理人: | 江亮 |
地址: | 325000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 串联 质谱图寻峰 算法 | ||
蛋白质组学串联质谱图寻峰算法,本发明的寻峰算法分为三个部分,采用核回归进行数据平滑处理,以避免滑动平均值算法会导致的峰被削平的情况,并且此算法在遇到邻近峰、宽峰时,表现优秀。为了克服仪器等因素带来的基线漂移问题,采用了自适应最小二乘法,这种算法迭代收敛速度极快的同时,能非常优秀的处理基线问题,弥补了数据平滑阶段的算力问题。最终对于峰值的查找,使用一维连续小波变换,其将质谱视为多个小波,进行局部化处理的方式,非常契合质谱中峰的形状特征,并且其计算速度极快,能够在对质谱图进行寻峰的过程中尽可能减少噪音干扰的要求,还能尽可能精准的标识出受处理的肽段的峰,以便于后续进行可信度衡量时,能有效溯源。
技术领域
本发明涉及蛋白质组学中蛋白质分析技术领域,具体涉及蛋白质组学串联质谱图寻峰算法。
背景技术
蛋白质组学(Proteomics)是研究细胞、组织或生物体中蛋白质组成、定位、变化及其相互作用规律的科学,蛋白质组学的发展对寻找疾病的诊断标志、筛选药物靶点、毒理学研究等有重要意义。蛋白质质谱分析技术可应用于蛋白质鉴定、蛋白质定量分析、蛋白质结构鉴定、蛋白基因组学等多个应用领域,在蛋白质组学里占非常重要的一环。
蛋白质质谱分析通过将实验得来的关于被检测蛋白的质谱图,利用计算的手段,将实验谱图与理论的蛋白进行匹配,最终确定待测蛋白中有哪些蛋白质的存在。
峰检测是基于质谱(MS)的蛋白质组学数据分析中重要的预处理步骤之一,质谱图中的峰信息往往就代表着蛋白质的信息。由于MS频谱中信号的复杂性和多噪声源,高的假阳性峰值识别率是一个主要问题,因此寻峰算法的目的就是通过降低质谱中噪声的信号,突出质谱中蛋白的信号,从而提高蛋白质质谱分析流程中对蛋白质的鉴定能力,从而得到更准确的蛋白质鉴定结果
目前,大多数峰值检测算法通过局部信噪比(SNR)超过一定阈值搜索局部最大值来识别峰值。信噪比的估计通常依赖于相对于周围噪声水平的峰值幅度。然而,高振幅并不总是保证真实的峰值:一些噪声源可能导致高振幅峰值。相反,低振幅峰值仍然可以是真实的。为了降低假阳性率,峰值检测算法施加了不同的约束。虽然这些约束的应用降低了算法的假阳性率,但也降低了方法的灵敏度,导致峰值未被检测出来。
现有软件与算法主要包括:
PeakSeeker
PeakSeeker是一种用于解决本质谱中的峰检测、峰重叠和电荷状态分配的综合算法。重叠峰通过检查原始质谱的二阶导数来检测,分子种类的电荷态分布是通过将电荷包络线的线性组合拟合到整个实验质谱中来确定的。
PeakSeeker通过应用基于二阶导数的峰值检测方法对重叠信号进行反卷积。二阶导数已广泛用于色谱、核磁共振和天文光谱的峰检测。PeakSeeker模拟了电荷包络,以便最好地拟合质谱中的峰。拟合优度由一个结合了质量误差和强度误差的评分函数决定。
基于连续小波变换(cwt)的峰值检测算法
Pan Du等人一种基于连续小波变换(CWT)的峰值检测算法,可以识别不同尺度和振幅的峰值通过将频谱转换为小波空间,简化了模式匹配问题,此外还为从尖峰噪声和有色噪声中识别和分离信号提供了强大的技术。这种变换,加上二维CWT系数提供的附加信息,可以大大提高有效信噪比。此外,使用这种技术,在峰检测之前不需要基线去除或峰平滑预处理步骤,这提高了在各种条件下的峰检测的灵敏度。基于CWT的算法可以在保持较低的假阳性率的同时识别出强峰值和弱峰值。
SOMMS
SOMMS(Solving complex Macromolecular Mass Spectra)使用高斯曲线拟合来模拟给定电荷状态窗口内蛋白质(亚)复合物的假定质谱。此外,该程序可以使用双项分布和多项分布模拟异质蛋白质复合物的光谱,它可以计算零电荷谱,并相对量化混合物中各组分的丰度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国科温州研究院(温州生物材料与工程研究所),未经国科温州研究院(温州生物材料与工程研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210953144.3/2.html,转载请声明来源钻瓜专利网。