[发明专利]一种多时间序列肠道菌群数据分析流程控制方法有效
申请号: | 202010801028.0 | 申请日: | 2020-08-11 |
公开(公告)号: | CN112151118B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 邓煜盛;韩丽娟;周勇 | 申请(专利权)人: | 康美华大基因技术有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B45/00;G16H50/30 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 杨艳 |
地址: | 518000 广东省深圳市宝安区西*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多时 序列 肠道 数据 分析 流程 控制 方法 | ||
1.一种多时间序列肠道菌群数据分析流程控制方法,其特征在于,包括以下步骤:
1)样本获取:获取同一个体不同时间点的人体肠道粪便样本和对应的个体基本信息;以及分别对每个样本进行肠道菌群基因提取,测序,与参考基因组比对注释方法获得每个样本对应的肠道菌群信息,并获得肠道菌群相对丰度信息;
2)肠道菌群信息预处理:分析汇总肠道菌群相对丰度数据,进行物种过滤,筛除低出现频次及低丰度物种;
3)多样性分析:流程计算样本alpha多样性和beta多样性,绘制alpha多样性指标误差折线图和物种组成图,以及降维后二维散点图和三维散点图;
4)聚类分析:根据肠道菌落相对丰度信息进行标准化处理和去除波动较小的物种相对丰度时间序列,根据序列波动情况进行序列聚类及可视化;
5)关联分析:分析肠道菌种与表型间的关联性,绘制关联结果热图;具体地,使用广义估计方程模型或混合线性模型进行肠道菌种与表型间关联分析及绘制关联结果热图;
6)菌落互作网络构建:计算两两样本间相似性、相关性和平移时间,获得物种互作网络关系,筛选出相似且相关物种,结合聚类结果和降维信息,绘制基于主坐标轴分析和聚类的互作关系网络图;
7)单一菌种变化趋势预测:对指定菌种进行平稳性及白噪声检验,符合条件的序列进一步进行差分整合移动平均自回归模型分析,根据贝叶斯信息准则筛选最佳模型,使用模型对指定菌种进行趋势预测。
2.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤1)中,时间点至少选取4个。
3.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤2)中,对步骤1)所得的肠道菌落数据进行归一化处理,每个样本所有种水平物种相对丰度加和为100%;低出现频次物种为在3%样品中出现,低丰度物种为所有样本相对丰度第90百分位数小于1的物种。
4.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤3)中,alpha多样性指标包括Shannon指数和Simpson指数,beta多样性是基于braycurtis距离进行主坐标分析降维,获得各样本的坐标信息;指定分组变量及时间变量后,绘制Shannon指数和Simpson指数误差折线图,各组物种组成图,以及嵌入核密度分布的二维散点图和三维散点图。
5.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤4)中,将肠道菌群相对丰度信息矩阵转成宽格式数据形式,即每行代表一个物种,每列为时间点,列按时间顺序排序;接着,对每个物种进行标准化处理:去除低波动物种,即标准差为0的物种,最终获得待分析候选菌种;然后使用欧式距离和动态时间规整计算两两序列间的距离,使用层次聚类进行序列聚类,绘制聚类热图;再分别使用层次聚类,Dbscan和Kmeans+方法进行聚类,绘制聚类折线图。
6.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤5)中,当选用广义估计方程模型时,指定工作矩阵;当选用混合线性模型时,指定固定效应及随机效应变量;若需要调整基线水平,将基线水平作为协变量进行模型分析;分析后对结果进行可视化,绘制关联热图,热图方格颜色表示关联系数大小,‘*’号表示关联系数对应的Pearson检验P值,P<0.05。
7.如权利要求1所述的多时间序列肠道菌群数据分析流程控制方法,其特征在于,步骤6)中,选取2个菌种时间序列,使用动态时间规整分析两个菌种序列间的距离及路径;根据路径对两个序列进行伸缩,填补丰度信息,获得伸缩后的新序列;接着使用Pearson检验对新序列进行关联分析,获得两新序列的关联系数及对应P值;分别以两个序列中之一为参照,另一个序列平移,计算不同参照不同平移时间的关联系数,选择最大值为其关联系数;筛选出相似且相关的菌种对,是根据Pearson检验P值和CORT关联系数进行筛选,选择P值小于0.05,CORT相关系数大于0.7的菌种对;绘制菌群降维后PCOA图;接着,根据聚类结果和菌群互作关系,在PCOA图中添加类别标识及互作关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康美华大基因技术有限公司,未经康美华大基因技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010801028.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置