[发明专利]基于质谱分析的肽谱存留时间预测方法及系统在审
申请号: | 202111076063.1 | 申请日: | 2021-09-14 |
公开(公告)号: | CN113936742A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 阮宏强;张鹏;刘泰驿 | 申请(专利权)人: | 上海中科新生命生物科技有限公司 |
主分类号: | G16B40/10 | 分类号: | G16B40/10;G16B20/00;G06N3/04;G01N27/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 肖平安 |
地址: | 201109 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 谱分析 存留 时间 预测 方法 系统 | ||
本发明提供一种基于质谱分析的肽谱存留时间预测方法及系统,包括:将谱图库中的肽段序列及肽段序列对应的保留时间转换为(肽段序列,保留时间)格式;将肽段序列按照氨基酸序列表进行转换得到肽段序列矩阵;构建双向循环神经网络模型:其中循环神经网络单细胞结构保存肽段序列矩阵及其对应的保留时间;遗忘门确认肽段序列矩阵是否保留;输入门根据遗忘门确认的结果更新肽段序列矩阵对应的保留时间;输出门输出更新后的肽段序列矩阵及对应的保留时间。通过对修饰成分进行编码,使得修饰成分对肽段序列存留时间的影响被考虑;同时通过双向循环神经网络模型,使得对肽段序列的存留时间的预测分析结果可靠。解决了如何准确预测肽谱的存留时间的问题。
技术领域
本发明涉及质谱分析技术领域,特别涉及一种基于质谱分析的肽谱存留时间预测方法及系统。
背景技术
蛋白质基因组学已经成为检测蛋白质序列的常规方法。通常,蛋白质序列是由基因组异常引起的,如单核苷酸变异(SNVs)、插入和缺失(INDELs)、RNA编辑、重连接或基因融合构造出转录区域。
通过对匹配样本同时进行全外显子组测序(WES)、RNA测序(RNA-seq)和质谱(MS)的散弹枪蛋白质组分析,能够从DNA和/或RNA测序数据中生成定制的、样品特异性的蛋白质数据库,然后根据定制的蛋白质数据库搜索MS数据,实现查找突变序列的工作。这种方式与仅依赖参考蛋白数据库的蛋白质组学数据分析不同,其允许识别未包括在参考(正常人)蛋白数据库中的肽,这为改进蛋白质编码基因组注释和识别疾病特异性蛋白序列提供了新的机会及方法。
传统DIA/DDA数据的分析需要一个谱图库,其中包含所有可被检测到的肽段母离子及其碎片离子的强度和预期的存留时间(RT)。液相色谱串联质谱(LC-MS)实验中的肽存留时间(RT),即仪器记录的肽从LC-MS柱中洗脱的时间点,是肽的一个固有特征。在利用谱图库对数据特征进行提取时,由于谱图库中含有预期的洗脱时间,因此提取的离子流色谱图可以限制在色谱图中的一个预期的特定窗口。但在特定窗口内进行目标离子的提取时会出现多个干扰峰,若能准确预测所有肽段的RT值,则各肽链中预测的RT值可与观察到的与光谱相关的RT值进行比较,便可以确定肽链的质量。因此若能准确预测肽段的存留时间,就可以将目标分析集中在某一个特征时间小片段上,从而提高分析的灵敏度和数据质量。
由此可见,能准确预测肽谱的存留时间RT,对更加灵敏地获得更为准确的肽链的质量有较大的贡献。然而目前还没有较为准确的肽谱的存留时间RT的预测方法。
发明内容
本发明的目的在于提供一种基于质谱分析的肽谱存留时间预测方法及系统,以解决如何准确预测肽谱的存留时间的问题。
为解决上述技术问题,本发明提供一种基于质谱分析的肽谱存留时间预测方法,所述肽谱存留时间预测方法包括:
制作输入数据:将谱图库中的肽段序列及肽段序列对应的保留时间转换为(A,B)格式,其中A为肽段序列,B为保留时间;
构建20维度的氨基酸序列表:所述氨基酸序列表包含人体蛋白质所含的20种氨基酸,每一氨基酸对应一个20位氨基序列码,不同氨基酸所对应的氨基序列码不同;
编码:将肽段序列按照氨基酸序列表进行转换,以得到肽段序列矩阵;
构建双向循环神经网络模型:包括构建循环神经网络单细胞结构、遗忘门、输入门和输出门;所述循环神经网络单细胞结构用于保存肽段序列矩阵及其对应的保留时间;所述遗忘门用于确认所述循环神经网络单细胞结构中保存的肽段序列矩阵哪些需要去除、哪些需要保留;所述输入门用于根据所述遗忘门确认的结果更新所述循环神经网络单细胞结构中保存的肽段序列矩阵对应的保留时间;所述输出门用于输出所述循环神经网络单细胞结构中保存的更新后的肽段序列矩阵及对应的保留时间;其中更新后的保留时间即为肽段序列的预测存留时间。
可选的,在所述的基于质谱分析的肽谱存留时间预测方法中,所述制作输入数据的方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海中科新生命生物科技有限公司,未经上海中科新生命生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111076063.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能安防摄像头
- 下一篇:基于液相色谱-质谱检测血清中特瑞普利单抗的方法