[发明专利]构建诱饵库、构建目标-诱饵库、代谢组FDR鉴定的方法及装置有效
申请号: | 201910606569.5 | 申请日: | 2019-07-05 |
公开(公告)号: | CN111883214B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 李德华;李尉;栾恩慧;龙巧云;宋佳平;李振宇;王雅兰 | 申请(专利权)人: | 深圳数字生命研究院;深圳微伴生物有限公司 |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B40/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 梁文惠 |
地址: | 518110 广东省深圳市龙华区观澜*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 诱饵 目标 代谢 fdr 鉴定 方法 装置 | ||
1.一种构建诱饵库的方法,其特征在于,包括以下步骤:
S1,将目标数据库中每张谱图的代谢物母离子质荷比M分别与所述目标数据库中其他所有谱图逐一比较,将存在子离子质荷比等于M的谱图和/或所述谱图的序号存储在信号谱索引数组中,遍历完所述目标数据库中所有的谱图,生成信号谱索引二维数组;
S2,选中所述信号谱索引二维数组中的一组信号谱索引数组,将所述信号谱索引数组中的每一张谱图的子离子信号存储在第一信号仓库中,随后从所述目标数据库中对应的谱图中随机选择部分子离子信号复制到数组D中,从所述第一信号仓库中随机选择一定数量的子离子信号填充到所述数组D中,使得所述数组D中的子离子信号数量与所述目标数据库中对应的谱图的子离子信号数量一致;然后随机选择所述数组D中的部分信号,随机改变其质荷比以避免与所述目标数据库中对应的谱图的质荷比重叠,遍历所述信号谱索引二维数组中的全部元素,得到n个数组D,所述n个数组D组成诱饵库信号数组;其中,n为自然数,所述对应为序号一致;以及
S3,将所述诱饵库信号数组中每个子集对应的所述目标数据库中谱图的母离子信息拷贝给所述诱饵库信号数组,形成诱饵库。
2.根据权利要求1所述的方法,其特征在于,所述S2中,所述随后从所述目标数据库中对应的谱图中随机选择部分子离子信号复制到数组D中所选择的子离子信号的数量占所述目标数据库中对应的谱图的全部子离子信号数量的比例为h,且h在0.6~0.9。
3.根据权利要求2所述的方法,其特征在于,所述h为0.775。
4.根据权利要求1所述的方法,其特征在于,所述S2中,所述随机改变其质荷比包括:添加或者减少大小随机的质荷比,其扰动值小于母离子质荷比。
5.根据权利要求4所述的方法,其特征在于,所述添加或者减少大小随机的质荷比包括统一加大小随机的质荷比、统一减大小随机的质荷比,或随机加/减大小随机的质荷比。
6.根据权利要求4所述的方法,其特征在于,扰动为±1Da。
7.根据权利要求4所述的方法,其特征在于,所选择的部分信号占所述数组D中总信号比例为k,k﹤1。
8.根据权利要求7所述的方法,其特征在于,所述k=0.5。
9.根据权利要求1所述的方法,其特征在于,所述S3中,所述目标数据库中谱图的母离子信息包括母离子的保留时间、质荷比和电荷信息。
10.一种构建目标-诱饵库的方法,其特征在于,包括:
挑选形成目标数据库;
构建诱饵库;以及
将所述目标数据库与所述诱饵库进行合并得到所述目标-诱饵库,其中,所述诱饵库通过如权利要求1至9中任一项所述的构建诱饵库的方法构建而成。
11.一种代谢组FDR鉴定的方法,其特征在于,包括:
将原始质谱数据转换为统一的谱图数据并读取,得到待鉴定谱图;
构建目标-诱饵库;
将所述待鉴定谱图与所述目标-诱饵库匹配;以及
将匹配结果进行排序以及对所述匹配结果进行FDR鉴定;
其中,所述目标-诱饵库通过如权利要求10所述的构建目标-诱饵库的方法构建而成。
12.根据权利要求11所述的方法,其特征在于,所述统一的谱图数据为含荷质比-峰强度信息的谱图数据文件。
13.根据权利要求12所述的方法,其特征在于,进一步将所述含荷质比-峰强度信息的谱图数据文件存储为数据链表,所述数据链表中存储的谱图信息包括谱图的编号、母离子保留时间、质荷比、电荷信息、子离子的质荷比和对应的峰强度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳数字生命研究院;深圳微伴生物有限公司,未经深圳数字生命研究院;深圳微伴生物有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910606569.5/1.html,转载请声明来源钻瓜专利网。