[发明专利]一种基于神经网络框架的肽段信号匹配方法有效
申请号: | 202011349418.5 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112464804B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 刘超;吴剑波;李阳;陈紫微;宫鹏云;郭一洁;李威铮;汤敏 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G16B20/00;G16B40/10 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 覃蛟 |
地址: | 100082*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 框架 信号 匹配 方法 | ||
本发明公开了一种基于神经网络框架的肽段信号匹配方法,该方法包括:在目标肽段的待匹配的完整色谱区间中对每个目标信号峰的待匹配峰集合进行粗打分,筛选出与每个目标信号峰待匹配的多个候选信号峰。对每个候选信号峰和对应的目标信号峰的组合进行细打分匹配,以细打分得分的最高分的组合的候选信号峰作为唯一匹配信号峰。其中,进行细打分的二层细打分网络训练为:提取目标信号峰与待匹配信号峰的11维特征向量作为输入,将配对正确与否的赋值作为输出,制作打分训练集,训练搭建的二层打分网络。该方法能够给出丰富的谱图解析结果,达到更高的肽段信号匹配精度和更快的匹配速度。
技术领域
本发明涉及生物技术与蛋白质组学技术领域,具体而言,涉及一种基于神经网络框架的肽段信号匹配方法。
背景技术
当前,蛋白质组学常采用质谱技术进行分析。其中一种主流算法的步骤是:首先酶切蛋白质,形成肽段。接着把肽段送入质谱仪,通过绘制一级谱图来反映离子信号从无到有再消失的过程。然后根据一级谱图相关信息在保留时间窗口内进行匹配,从另一个运行程序中得到对应色谱区间的肽段信息。最后按照以上步骤分批处理到来的组分,得到相应的质谱数据集,再通过算法推得蛋白质种类以及含量。其中,一级谱图的横坐标是谱峰信号的谱峰质荷比(mass-to-charge ratio,m/z),纵坐标是谱峰强度(Intensity),同一肽段的不同分子的同位素形成多同位素模式。
现有肽段保留时间匹配软件有MaxQuant软件等,但是普遍存在运行效率低的情况,因此,不能满足当前数据处理的要求。具体地,现有匹配软件主要存在以下缺点:
1.现有软件能解析的谱图数量有限,许多谱图无法进行解析,使得肽段定量值较少,效率低下。
2.现有软件只能给出定性分析,但是不能对每个相对蛋白质定量结果给出可信度评价。需要进一步进行可靠性评估来对结果进行优化。
3.现有软件处理数据效率不高,运行时间长。
鉴于此,特提出本发明。
发明内容
本发明的目的在于提供一种基于神经网络框架的肽段信号匹配方法,以改善上述问题。
本发明是这样实现的:
本发明提供了一种基于神经网络框架的肽段信号匹配方法,其包括:
在目标肽段的待匹配的完整色谱区间中对每个目标信号峰的待匹配峰集合进行粗打分,筛选出与每个目标信号峰待匹配的多个候选信号峰。
对每个候选信号峰和对应的目标信号峰的组合进行细打分匹配,以细打分得分的最高分的组合的候选信号峰作为唯一匹配信号峰。
其中,细打分匹配是通过二层细打分网络来进行打分,二层细打分网络通过以下步骤训练得到:以目标肽段所对应的一个目标信号峰和待匹配的完整色谱区间中的一个待匹配信号峰为一个匹配峰对,在所有目标肽段所对应的目标信号峰与待匹配的完整色谱区间中,提取多个匹配峰对的11维特征向量作为输入,将配对正确与否的赋值作为输出,制作打分训练集,训练搭建的二层打分网络,得到二层细打分网络。
11维特征向量包括:
两个强度类特征向量:目标信号峰同位素峰簇的谱峰的强度和与待匹配信号峰同位素峰簇的谱峰强度和;七个信号相似度类特征向量:目标信号峰与待匹配信号峰同位素峰簇的谱峰的整体相似度;目标信号峰与待匹配信号峰之间同位素峰簇的前三谱峰的相似度;待匹配信号峰同位素峰簇内的前三谱峰之间的相似度,前三谱峰指单同位素峰,第1同位素峰以及第2同位素峰,色谱相似度的计算方法均为向量夹角余弦;两个位置类特征向量:目标信号峰与待匹配信号峰在各自样品中鉴定的时间差;目标信号峰与待匹配信号峰在各自样品中鉴定的时间差经过高斯函数进行拟合的拟合值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011349418.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种绒布加工设备
- 下一篇:一种计算机网络安全控制系统及控制方法