[发明专利]一种特征交叉融合的时间序列峰簇精确定位方法在审
申请号: | 202110293557.9 | 申请日: | 2021-03-19 |
公开(公告)号: | CN112908428A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 冯筠;陆柯迪;孙士生;胡陟 | 申请(专利权)人: | 西北大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G01N30/86;G06N3/12 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 王孝明 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 交叉 融合 时间 序列 精确 定位 方法 | ||
1.一种特征交叉融合的时间序列峰簇精确定位方法,其特征在于,该方法按照以下步骤进行:
步骤一,对糖肽质谱数据集进行鉴定,得到鉴定结果数据集;
所述的糖肽质谱数据集为多个原始质谱文件;
所述的鉴定结果数据集包括重复鉴定离子数据集r-Set和未匹配离子数据集;
所述的重复鉴定离子数据集r-Set包括糖肽质量、电荷、二级谱图编号、糖结构编号和肽链组成;所述的未匹配离子数据集包括糖肽质量,电荷,二级质谱图编号,糖肽结构编号和肽链组成;
步骤二,建立原始质谱数据间的基于随机扰动的时间加权全局粗校准模型,用重复鉴定离子数据集r-Set进行模型参数训练,得到基于随机扰动的时间加权粗校准模型;使用基于随机扰动的时间加权粗校准模型对未匹配离子数据集完成粗校准,得到粗校准结果;
所述的原始质谱数据间基于随机扰动的时间加权全局粗校准模型如公式2-1所示:
Ttarget=Slope*Ttemplate+offset 公式2-1
其中:
Ttemplate表示作为模板的原始质谱文件的洗脱时间;
Ttarget表示作为目标的原始质谱文件的洗脱时间;
Slope表示原始质谱文件间的洗脱时间平均变化率;
offset表示原始质谱文件间的洗脱时间偏移;
所述的粗校准结果包括未匹配离子的质荷比估计值和未匹配离子的洗脱时间估计值;
步骤三,根据粗校准结果得到最佳匹配峰簇CPeak-b,采用峰特征交叉融合公式3-3计算模板峰簇和候选峰簇的相关值S,比较相关值S与临界值Scv的大小,判定最佳匹配峰簇CPeak-b是否为精确定位结果:
所述的峰特征交叉融合公式3-3为:
f(s′,z1⊙z2,MA1⊙MA2)=s′+(z1⊙z2)+(MA1⊙MA2) 公式3-4
其中:
z1表示模板峰簇对应糖肽离子的电荷;
z2表示候选峰簇对应糖肽离子的电荷;
MA1表示模板峰簇对应糖肽离子的质量;
MA2表示候选峰簇对应糖肽离子的质量;
s′为模板峰簇的同位素峰簇和候选峰簇的同位素峰簇间的皮尔逊相关系数;
所述的判定最佳匹配峰簇CPeak-b是否为精确定位结果具体过程为:当相关值S小于Scv时,则最佳匹配峰簇CPeak-b的正确性为峰簇匹配不正确,重复步骤3.2~3.4,再计算候选峰簇与模板峰簇之间的相关值S,直至满足相关值S大于设定的临界值Scv时,则最佳匹配峰簇CPeak-b的正确性为峰簇匹配正确,则判定定位成功,此时,对应的CPeak-b即为精确定位的结果;
若候选色谱图中所有峰簇都没有满足相关值S大于设定的临界值Scv时,则判定定位失败。
2.如权利要求1所述的特征交叉融合的时间序列峰簇精确定位方法,其特征在于,所述的粗校准结果得到最佳匹配峰簇CPeak-b的具体过程为:
步骤3.1,根据粗校准结果,在原始质谱数据中提取模板色谱流图TXIC,候选色谱流图CXIC;
步骤3.2,采用动态规划方法计算TXIC与CXIC的最佳匹配峰簇CPeak-b;
步骤3.3,将未匹配离子数据集中的糖肽质量和电荷输入到三维信息差异下的多电荷混叠峰簇分离提取方法中,得到模板峰簇相关信息TPeak,候选峰簇相关信息CPeak;
所述的峰簇相关信息包括糖肽离子的质量、糖肽离子的电荷、糖肽离子的同位素峰簇和糖肽离子的洗脱时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293557.9/1.html,转载请声明来源钻瓜专利网。