[发明专利]一种单、多元变量相结合的数据分析方法无效

专利信息
申请号: 201310171202.8 申请日: 2013-05-10
公开(公告)号: CN103714233A 公开(公告)日: 2014-04-09
发明(设计)人: 徐捷;其他发明人请求不公开姓名 申请(专利权)人: 上海阿趣生物科技有限公司
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 200433 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多元 变量 相结合 数据 分析 方法
【说明书】:

技术领域

发明数据分析方法(XMS)是一种可以针对各种主流分析仪器原始数据进行预处理,单、多元变量分析以及后期图表生成导出的数据分析方法。可应用于生物学、医学、化学等相关领域。 

背景技术

复杂仪器数据分析技术是一种通过比较复杂或特殊的仪器设备测量出物质的某些物理或物理化学性质的参数及其变化来获取物质的化学组成﹑成分含量以及化学结构等信息的一类方法。它是以统计方法对所得参数进行数据处理的分析方法。统计方法一般归为两类:单变量分析和多变量分析。 

单变量分析主要集中在单变量的描述和统计推断两个方面,在于用最简单的概括形式反映出大量样本资料所容纳的基本信息,描述样本数据中的集中或离散趋势,单变量统计推断则是从样本资料来推断总体的情况,主要包括区间估计和统计假设检验。描述单变量的样本集中趋势,常用的统计描述方式有均值,众数和中位数。区间估计是指在一定的置信度范围下对总体的取值区间的估计。统计假设是先对总体的某个参数做出假设,然后用样本统计量来验证假设,从而决定对假设的接受或拒绝。 

多变量分析为统计方法的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。多元分析是指对多个变量同时进行显示和分析。通常一个最简单的图表是由X轴和Y轴组成的。X轴通常用来显示维的数据,比如地区,时间等等。Y轴用于对变量的显示,比如销售额,盈利额等等。如果我们需要看两个变量之间的关系,也可以把这两组数据用点涂分别画在X和Y轴的方向。这也叫做散点图(Scatter plot)。统计学中的多变量统计分析起源于医学和心理学。1930年代它在理论上发展很快,但由于计算复杂,实际应用很少。1970年代以来由于计算机的蓬勃发展和普及,多变量统计分析已渗入到几乎所有的学科。到80年代后期,计算机软件包已很普遍,使用也方便,因此多变量分析方法也更为普及。目前将单﹑多元变量分析相结合的方法可以更加完整的反应通过复杂仪器测量多样本各物质之间的相互关系以及各样本之间的差异,更准确的为科研人员寻找潜在生物标记物,具有极大的产业化前景,成为生物技术以及医药领域一大开发热点。 

与传统的软件数据分析方法,如SPSS、SIMCA-P+、Excel,相比较具有其独特的优势: 

1)操作简单,一步完成,无需专门技术人员操作,无需专业的统计学基础;

2)数据完善,既可以做简单数据预处理,还可以获得所有单﹑多元分析数据处理结果;

3)结果直观,利用图﹑表的形式呈现;

4)数据分析无需依赖多个数据软件,一种分析技术方法可以获得物质所有相关信息;

5)成本低。

结合上述数据分析技术的特点,我们就可以发现该分析技术方法特别适用于对气质联用(GC-MS),液质联用(LC-MS),核磁共振(NMR)等分析仪器所导出的原始数据,是现代生物科技领域不可或缺的一项进步性创新。 

发明内容

将所有用来分析复杂仪器数据参数方法相结合,XMS共分为四个部分: 一,对多样本初始数据缺失值的填补,异常值的筛选,归一化等数据预处理;二,数据分析:主成分分析(PCA),偏最小二乘法判别分析(PLS-DA),正交最小二乘法分析(OPLS);三,自动生成两组样本之间倍数变化关系值(FOLD CHANGE),学生T检验TTEST值(p-value),变量重要性variable importance值(VIP)等差异物筛选特征值表格;四,以图表等直观的表现方法通过压缩文件夹形式导出所需数据处理结果result.zip。实现两组样本之间差异物筛选,潜在生物标记物发现的最终目的,获得差异物特征图(Differential feature plot),简称Diff plot(图1)。Diff plot可以通过科研人员自行选择差异物筛选标准,包括p-value<=阈值,FOLD CHANGE>=阈值以及p-value<=阈值,VIP>=阈值两个筛选条件。绿色代表上调,红色代表下调。 球形大小代表FOLD CHANGE的log值的大小。球形颜色的深浅度与p-value值的大小成反比,即颜色越深,对应的p-value值越小。 

XMS数据分析方法的难点在于XMS方法数据包的稳定性以及与软件的兼容性。 

XMS数据分析方法相对于传统软件数据分析方法的优点 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海阿趣生物科技有限公司,未经上海阿趣生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310171202.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top