[发明专利]一种单、多元变量相结合的数据分析方法无效
申请号: | 201310171202.8 | 申请日: | 2013-05-10 |
公开(公告)号: | CN103714233A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 徐捷;其他发明人请求不公开姓名 | 申请(专利权)人: | 上海阿趣生物科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多元 变量 相结合 数据 分析 方法 | ||
技术领域
本发明数据分析方法(XMS)是一种可以针对各种主流分析仪器原始数据进行预处理,单、多元变量分析以及后期图表生成导出的数据分析方法。可应用于生物学、医学、化学等相关领域。
背景技术
复杂仪器数据分析技术是一种通过比较复杂或特殊的仪器设备测量出物质的某些物理或物理化学性质的参数及其变化来获取物质的化学组成﹑成分含量以及化学结构等信息的一类方法。它是以统计方法对所得参数进行数据处理的分析方法。统计方法一般归为两类:单变量分析和多变量分析。
单变量分析主要集中在单变量的描述和统计推断两个方面,在于用最简单的概括形式反映出大量样本资料所容纳的基本信息,描述样本数据中的集中或离散趋势,单变量统计推断则是从样本资料来推断总体的情况,主要包括区间估计和统计假设检验。描述单变量的样本集中趋势,常用的统计描述方式有均值,众数和中位数。区间估计是指在一定的置信度范围下对总体的取值区间的估计。统计假设是先对总体的某个参数做出假设,然后用样本统计量来验证假设,从而决定对假设的接受或拒绝。
多变量分析为统计方法的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。多元分析是指对多个变量同时进行显示和分析。通常一个最简单的图表是由X轴和Y轴组成的。X轴通常用来显示维的数据,比如地区,时间等等。Y轴用于对变量的显示,比如销售额,盈利额等等。如果我们需要看两个变量之间的关系,也可以把这两组数据用点涂分别画在X和Y轴的方向。这也叫做散点图(Scatter plot)。统计学中的多变量统计分析起源于医学和心理学。1930年代它在理论上发展很快,但由于计算复杂,实际应用很少。1970年代以来由于计算机的蓬勃发展和普及,多变量统计分析已渗入到几乎所有的学科。到80年代后期,计算机软件包已很普遍,使用也方便,因此多变量分析方法也更为普及。目前将单﹑多元变量分析相结合的方法可以更加完整的反应通过复杂仪器测量多样本各物质之间的相互关系以及各样本之间的差异,更准确的为科研人员寻找潜在生物标记物,具有极大的产业化前景,成为生物技术以及医药领域一大开发热点。
与传统的软件数据分析方法,如SPSS、SIMCA-P+、Excel,相比较具有其独特的优势:
1)操作简单,一步完成,无需专门技术人员操作,无需专业的统计学基础;
2)数据完善,既可以做简单数据预处理,还可以获得所有单﹑多元分析数据处理结果;
3)结果直观,利用图﹑表的形式呈现;
4)数据分析无需依赖多个数据软件,一种分析技术方法可以获得物质所有相关信息;
5)成本低。
结合上述数据分析技术的特点,我们就可以发现该分析技术方法特别适用于对气质联用(GC-MS),液质联用(LC-MS),核磁共振(NMR)等分析仪器所导出的原始数据,是现代生物科技领域不可或缺的一项进步性创新。
发明内容
将所有用来分析复杂仪器数据参数方法相结合,XMS共分为四个部分: 一,对多样本初始数据缺失值的填补,异常值的筛选,归一化等数据预处理;二,数据分析:主成分分析(PCA),偏最小二乘法判别分析(PLS-DA),正交最小二乘法分析(OPLS);三,自动生成两组样本之间倍数变化关系值(FOLD CHANGE),学生T检验TTEST值(p-value),变量重要性variable importance值(VIP)等差异物筛选特征值表格;四,以图表等直观的表现方法通过压缩文件夹形式导出所需数据处理结果result.zip。实现两组样本之间差异物筛选,潜在生物标记物发现的最终目的,获得差异物特征图(Differential feature plot),简称Diff plot(图1)。Diff plot可以通过科研人员自行选择差异物筛选标准,包括p-value<=阈值,FOLD CHANGE>=阈值以及p-value<=阈值,VIP>=阈值两个筛选条件。绿色代表上调,红色代表下调。 球形大小代表FOLD CHANGE的log值的大小。球形颜色的深浅度与p-value值的大小成反比,即颜色越深,对应的p-value值越小。
XMS数据分析方法的难点在于XMS方法数据包的稳定性以及与软件的兼容性。
XMS数据分析方法相对于传统软件数据分析方法的优点
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海阿趣生物科技有限公司,未经上海阿趣生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310171202.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海上平台的T型烟道
- 下一篇:阳极焙烧炉火焰喷射装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置