[发明专利]一种基于非线性拟合方式的肽质谱峰特征参数提取方法有效

专利信息
申请号: 201410498854.7 申请日: 2014-09-25
公开(公告)号: CN104316591A 公开(公告)日: 2015-01-28
发明(设计)人: 易志强;李芸;章剑秋;曾嵘;姚英彪;张福洪;李希元 申请(专利权)人: 杭州电子科技大学
主分类号: G01N27/62 分类号: G01N27/62
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 杜军
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 非线性 拟合 方式 肽质谱峰 特征 参数 提取 方法
【说明书】:

技术领域

发明属于生物质谱数据预处理及信息提取技术领域,具体涉及一种基于非线性拟合方式的肽质谱峰特征参数提取方法。

背景技术

基于串联质谱的肽鉴定是目前蛋白质组研究领域中广泛使用的技术。待鉴定的肽在质谱仪中被碎裂为碎片离子,从而生成串联质谱数据,并与理论串联质谱库或已鉴定的肽段质谱库进行比对及分析,最后完成对未知肽段的鉴定。

通常情况下对某种离子进行质谱检测,所检测到的质荷比数据不是单一数值点,而是存在若干样点,在质谱图上其拟合为高斯曲线,即高斯峰。为确定该离子的荷质比,需对这些样点进行预处理,计算出其横轴方向上的质心(Centroid),即该离子的实测质荷比。根据所求质心,可进而推算出该离子最大丰度值等其他特征参数。目前质心求解方法有多种,比较常见的思路是:假定质谱图上构成高斯峰的各个样点均严格分布在某条高斯曲线上,利用各样点的数值(质荷比和丰度值),代入到参数未知的通用高斯曲线函数表达式中,构造联立方程组,从而解出相应高斯峰的特征参数,包括质心,最大丰度值等。当前应用极为广泛的一款蛋白质组学数据分析软件MAXQUANT采用的即是这一方法。然而在实际检测中,受实验条件、所在环境以及仪器设备噪声等因素的影响,质谱图上各个样点往往并非严格分布在高斯曲线上,而是存在一定偏差。当各个样点偏差数值较大,则上述方法中的假设条件难以成立,因而势必造成求解出的特征参数在数值上存在较大误差,进而影响到肽段鉴定的精度。

发明内容

本发明的目的在于解决上述方法的缺点和不足,提出一种基于非线性拟合方式的肽质谱峰特征参数提取方法。

设质谱图中某离子的高斯峰由N个样点组成,通常情况下N≥3。对样点按其丰度值从大到小排序后,其坐标构成集合A。

A={(m1,d1),(m2,d2),…(mN,dN)}

其中,mi表示质荷比,di表示丰度,其值大于0,i∈{1,2,3,…,N}。需要通过样点拟合出的高斯曲线其函数形式设为:

f(x,P)=p1×e-(x-p2p3)2]]>

其中,函数f(x,P)代表丰度值,自变量x代表质荷比,p1、p2和p3为待求解的高斯曲线特征参数,分别表征缩放因子、质心、标准差,构成特征参数向量P=[p1 p2 p3]。所述的特征参数提取方法处理步骤如下:

步骤(1)根据丰度值最大的3个样点数据,对高斯曲线特征参数赋初值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410498854.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top