[发明专利]一种基于神经网络框架的肽段信号匹配方法有效
申请号: | 202011349418.5 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112464804B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 刘超;吴剑波;李阳;陈紫微;宫鹏云;郭一洁;李威铮;汤敏 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G16B20/00;G16B40/10 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 覃蛟 |
地址: | 100082*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 框架 信号 匹配 方法 | ||
1.一种基于神经网络框架的肽段信号匹配方法,其特征在于,其包括:
在目标肽段的待匹配的完整色谱区间中对每个目标信号峰的待匹配峰集合进行粗打分,筛选出与每个所述目标信号峰待匹配的多个候选信号峰;
对每个所述候选信号峰和对应的所述目标信号峰的组合进行细打分匹配,以细打分得分的最高分的组合的候选信号峰作为唯一匹配信号峰;
其中,所述细打分匹配是通过二层细打分网络来进行打分,所述二层细打分网络通过以下步骤训练得到:以目标肽段所对应的目标信号峰和待匹配的完整色谱区间中的一个待匹配信号峰为一个匹配峰对,在所有目标肽段所对应的目标信号峰与待匹配的完整色谱区间中,提取多个所述匹配峰对的11维特征向量作为输入,将配对正确与否的赋值作为输出,以制作打分训练集,训练搭建的二层打分网络,得到二层细打分网络;
所述11维特征向量包括:
两个强度类特征向量:目标信号峰同位素峰簇的谱峰的强度和与待匹配信号峰同位素峰簇的谱峰强度和;
七个信号相似度类特征向量:目标信号峰与待匹配信号峰同位素峰簇的谱峰的整体相似度;目标信号峰与待匹配信号峰之间同位素峰簇的前三谱峰的相似度;待匹配信号峰同位素峰簇内的前三谱峰之间的相似度,前三谱峰指单同位素峰,第1同位素峰以及第2同位素峰,色谱相似度的计算方法均为向量夹角余弦;
两个位置类特征向量:目标信号峰与待匹配信号峰在各自样品中鉴定的时间差;目标信号峰与待匹配信号峰在各自样品中鉴定的时间差经过高斯函数进行拟合的拟合值。
2.根据权利要求1所述的基于神经网络框架的肽段信号匹配方法,其特征在于,制作打分训练集的步骤包括:主要通过计算待匹配信号峰与目标信号峰之间的同位素峰簇余弦相似度、ratio值、和竞争峰之间的cos值差以及待匹配信号峰距离中心的位置来进行筛选,筛选出至少300个保证准确率的正确的匹配峰对,标注为正确,形成标注集合的正样本;其中,ratio为待匹配信号峰与目标信号峰之间同位素峰簇强度和比值;
以正样本中待匹配信号峰集合中的正确匹配信号峰为最高标准,在除去正确匹配信号峰的待匹配信号峰集合中进行筛选,提取与其具有最小差距的错误的匹配信号峰,筛选出至少300个保证错误率的错误的匹配峰对,标注为错误,形成标注集合的负样本。
3.根据权利要求2所述的基于神经网络框架的肽段信号匹配方法,其特征在于,筛选正确的匹配峰对包括:判断是否同时满足以下条件:待匹配信号峰与目标信号峰之间的同位素峰簇余弦相似>0.9;ratio1.3;和竞争峰之间的cos值差0.05;待匹配信号峰距离中心的位置完整区间长度的10%,同时满足四个条件的待匹配信号峰为正确匹配信号峰。
4.根据权利要求3所述的基于神经网络框架的肽段信号匹配方法,其特征在于,色谱数据以RAW文件的形式在质量和保留时间窗口内进行匹配,然后将肽段标识从已识别的肽上转移到相邻的未测序或未识别的肽上,通过提取母离子在各保留时间处的峰值,绘制色谱曲线,反映信号在质谱仪中的强度变化过程。
5.根据权利要求1~4任一项所述的基于神经网络框架的肽段信号匹配方法,其特征在于,训练搭建的二层打分网络采用两层神经网络,激活函数依次采用ReLU和Softmax,损失函数采用交叉熵,优化器采用SGD,调整好相应参数,然后进行训练,直到loss曲线下降至平稳。
6.根据权利要求1~4任一项所述的基于神经网络框架的肽段信号匹配方法,其特征在于,对每个所述候选信号峰和对应的所述目标信号峰的组合进行细打分匹配包括:将每个所述候选信号峰和对应的所述目标信号峰的组合的11维特征向量输入训练好的二层细打分网络中,对所述目标信号峰与多个所述候选信号峰之间的匹配情况进行打分,并将打分结果0×c0+1×c1进行输出,并对打分结果进行排序,其中,c0元素代表匹配失败的概率,c1元素代表匹配成功的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011349418.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种绒布加工设备
- 下一篇:一种计算机网络安全控制系统及控制方法