[发明专利]一种质谱数据分析方法有效
申请号: | 201710674793.9 | 申请日: | 2017-08-09 |
公开(公告)号: | CN107818329B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王乾;胡畅 | 申请(专利权)人: | 亿纳谱(浙江)生物科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/2413 |
代理公司: | 上海世圆知识产权代理有限公司 31320 | 代理人: | 陈颖洁;王佳妮 |
地址: | 310053 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种质 数据 分析 方法 | ||
1.一种质谱数据分析方法,其特征在于,包括如下步骤:
样本数据采集步骤,用以采集两个以上体液样本的质谱数据并根据所述质谱数据生成质谱图;所述体液样本包括两个以上训练样本及至少一个测试样本;所述训练样本被分成两个以上组别,同一组别的训练样本标识有相同的组别标签;
样本数据预处理步骤,用以对至少一组质谱数据进行预处理,对所述质谱图进行坐标变换处理,获得所述训练样本及所述测试样本的标准化质谱数据;
数据模型构建及交叉验证步骤,用以利用所述训练样本的标准化质谱数据及所述训练样本的组别标签构建初级数据模型,根据所述训练样本的标准化质谱数据对所述初级数据模型进行至少一次的交叉验证处理;
数据模型优化步骤,用以根据交叉验证的结果构建优化数据模型;以及
样本组别判断步骤,用以利用所述测试样本的标准化质谱数据及所述优化数据模型获取所述测试样本的组别标签;
所述样本数据采集步骤,具体包括如下步骤:
获取两个以上体液样本;
将全部所述体液样本在一平板上排列成矩阵;以及
利用质谱法采集所述体液样本的质谱数据并生成质谱图;每一体液样本采集至少一组质谱数据;
所述数据模型构建及交叉验证步骤,具体包括如下步骤:
任选一训练样本作为标准训练样本,其组别标签已知;
以所述标准训练样本的位置为圆心,以特定长度r为半径,在所述平板上设定一个圆形区域;
根据所述圆形区域内除所述标准训练样本外的其他训练样本的标准化质谱数据构建矩阵D,所述矩阵D中每一列数据分别对应一训练样本的一组标准化质谱数据;
根据所述圆形区域内除所述标准训练样本外的其他训练样本的组别标签获取向量每一训练样本的组别标签记录在向量中;
利用稀疏学习优化算法建立初级数据模型
将所述标准训练样本的两组以上标准化质谱数据与所述数据模型相乘,将其乘积按照数值大小排成数列,对其中位值进行取整处理,获取所述标准训练样本的推测组别标签;
对比所述标准训练样本的推测组别标签与其组别标签,若二者相同,则判定所述标准训练样本的组别标签推测正确,正确度计数器加一;
依次将每一个训练样本作为标准训练样本,重复上述各个步骤,对所有的训练样本进行交叉验证处理,计算出在半径为r的情况下所述训练样本的组别标签判断准确率,所述组别标签判断准确率为正确度计数器的数值与所述训练样本总数的比值;
调整半径r的大小,重复上述各个步骤,计算出在半径r为不同数值的情况下的组别标签判断准确率;以及
从两个以上组别标签判断准确率中选取一个准确率最大值,获取对应该准确率最大值的半径r的最优值R。
2.如权利要求1所述的质谱数据分析方法,其特征在于,
所述测试样本位于所述平板的中部,所述训练样本围绕所述测试样本;
所述平板包括但不限于基质金属板;
任意两个相邻的训练样本的组别标签皆不同;
任意两个相邻体液样本的距离大于或等于2mm,且小于或等于5mm。
3.如权利要求1所述的质谱数据分析方法,其特征在于,
每一组质谱数据包括样本中一离子的质荷比值及对应该离子的信号实测强度值;
每一组质谱数据对应所述质谱图中一个采样点;
每一个采样点的横坐标表示一离子的质荷比值,其纵坐标表示对应该离子的信号实测强度值。
4.如权利要求1所述的质谱数据分析方法,其特征在于,
所述样本数据预处理步骤具体包括如下步骤:
基线校正步骤,用以对所述质谱图中的质谱数据做基线校正处理;
重采样步骤,用以利用重采样算法对基线校正后的质谱数据中的离子质荷比值进行重采样处理,对所述质谱图进行横坐标变换,统一所有质谱数据的质荷比,获得重采样质谱数据;以及
标准化步骤,用以对所述重采样质谱数据中离子信号强度值进行标准化处理,对所述质谱图进行纵坐标变换,获得标准化质谱数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿纳谱(浙江)生物科技有限公司,未经亿纳谱(浙江)生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710674793.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置