[发明专利]一种多组学数据联合分析的方法有效
申请号: | 201810111865.3 | 申请日: | 2018-02-05 |
公开(公告)号: | CN110211634B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 朱欠华;高强;杨林峰;唐冲;刘赤川;何长寿 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B40/00;G16B50/00 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅;张立娜 |
地址: | 518083 广东省深圳市盐*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多组学 数据 联合 分析 方法 | ||
1.一种多组学数据联合分析的方法,包括如下步骤:
(A)对待分析的多组学数据中的每个单一组学的指标数据进行共表达网络分析,找到各自的表达模块;
(B)根据步骤(A)得到的不同组学数据各自的表达模块之间的重叠关系,筛选出所述待分析的多组学数据之间显著相关的互作模块;
步骤(B)中,是利用超几何分布检验的方法根据不同组学数据各自的所述表达模块之间的重叠关系,筛选出所述待分析的多组学数据中的互作模块的。
2.根据权利要求1所述的方法,其特征在于:步骤(A)中,是基于聚类方法对所述单一组学的指标数据进行共表达网络分析,从而找到所述单一组学的指标数据的所述表达模块的。
3.根据权利要求1或2所述的方法,其特征在于:步骤(A)中,是按照包括如下步骤的方法对所述单一组学的指标数据进行共表达网络分析,从而找到所述单一组学的指标数据的所述表达模块的:
(a1)计算所述单一组学的指标数据中任意两个指标之间的Pearson相关性系数,得到相关性系数矩阵;
(a2)按照无尺度网络的标准选择邻接矩阵的权重参数β值;
(a3)根据步骤(a2)中得到的β值,计算步骤(a1)中相关性系数矩阵的邻接矩阵;
(a4)用1减去步骤(a3)中的邻接矩阵所得数值作为距离,构建系统聚类树;然后根据混合动态剪切树确定分类模块,即得到所述单一组学的指标数据的所述表达模块。
4.根据权利要求3所述的方法,其特征在于:步骤(a1)中,用于计算任意两个指标之间的Pearson相关性系数的所述单一组学的指标数据为经过预处理后得到预处理后数据。
5.根据权利要求4所述的方法,其特征在于:所述预处理包括删除缺失率高于设定阈值的数据。
6.根据权利要求5所述的方法,其特征在于:所述设定阈值为0.2。
7.根据权利要求3所述的方法,其特征在于:步骤(a2)中,是按照包括如下步骤的方法确定所述β值的:
(i)β值分别取1到30的正整数,分别计算各β值对应的R2值;所述R2值是共表达网络中某节点连接度的对数和该节点出现的概率的对数之间的相关性系数的平方值;
(ii)按照如下确定所述β值:
第一种情况:如果存在所述R2值大于等于0.9,则取第一个出现的所述R2值大于等于0.9时对应的β值;
第二种情况:如果所有的所述R2值都小于0.9,则将所述R2值和所述β值进行局部多项式回归分析,取第一个饱和点的所述R2值对应的β值;
第三种情况:如果不存在满足所述第一种情况和所述第二种情况的β值,则取β值为30。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810111865.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置