[发明专利]一种基于时间序列宏基因组数据的动态观测装置及其检测方法有效
申请号: | 202010801019.1 | 申请日: | 2020-08-11 |
公开(公告)号: | CN112151117B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 邓煜盛;韩丽娟;周勇 | 申请(专利权)人: | 康美华大基因技术有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B45/00;G16H50/30 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 杨艳 |
地址: | 518000 广东省深圳市宝安区西*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时间 序列 宏基 数据 动态 观测 装置 及其 检测 方法 | ||
1.一种基于时间序列宏基因组数据的动态观测装置,其特征在于,包括:
用于采集人体肠道粪便不同时间点样本的采集装置;对采集到的肠道菌群样本进行基因提取和测序,得到肠道菌落信息的测序装置;用于分析肠道菌落相对丰度信息,以得到待分析菌落的预处理分析装置;用于将待分析菌落进行菌种相似度、菌种相关性、菌种互作关系、菌群聚类及降维、菌群互作网络构建和关键菌种识别的数据分析装置;存储装置;显示器;
采集装置、测序装置、预处理分析装置和数据分析装置从前到后依次连接;存储装置分别与采集装置、预处理分析装置和数据分析装置连接;显示器与数据分析装置连接;
基于时间序列宏基因组数据的动态观测装置的检测方法,包括以下步骤:
1)样本获取:获取同一个体不同时间点的人体肠道粪便样本和对应的个体基本信息;分别对每个样本进行肠道菌群基因提取、测序,与参考基因组比对注释方法获得每个样本对应的肠道菌群信息,并获得肠道菌群相对丰度信息;
2)肠道菌群信息预处理:根据步骤1)所得的肠道菌群相对丰度信息,进行物种过滤,筛除低出现频次及低丰度物种;过滤后进行归一化处理后转成宽格式数据形式,再对每个物种进行标准化处理;最后,过滤低波动物种,获得待分析候选菌落;
3)菌种相似度计算:将步骤2)所得的待分析候选菌落全部分为两两一组,得到每组菌落中两个菌种的时间序列,使用动态时间规整分析对两个序列进行伸缩,获得伸缩后的新序列;接着使用Pearson对新序列进行关联分析,获得两个新序列的相关系数和对应P值;
4)菌种相关性及平移时间计算:将步骤3)所得的两个新序列的其中一个菌种序列X为参照,另一个菌种序列Y按单位时间间隔进行从负到正进行平移,序列缺少位置按末尾值进行填补;每平移一次,使用时间相关系数进行关联分析获得关联系数;以Y序列为参照,X序列进行平移计算关联系数;选择所有关联系数中绝对值的最大值为两者关联程度,对应关联系数正负为关联方向,对应的平移位置为两序列的平移时间,正负值表示两序列出现前后顺序;
5)菌群互作关系计算:根据步骤3)所得的两个菌落的相关系数以及步骤4)所得的两个菌落间的关联系数和平移时间,形成菌群互作关系矩阵;将步骤3)所得的P值和步骤4)所得的关联系数汇总,并设定P值和关联系数的标准值,筛选出符合标准值的相似且相关的菌种对,为最终菌群互作关系网;
6)菌群聚类及降维计算:使用基于欧式距离的动态时间归整方法计算两两菌种距离,形成菌种距离矩阵;利用菌种距离矩阵,使用层次聚类方法对菌群进行聚类,根据不同距离大小,选取聚类数;利用菌种距离矩阵,使用主坐标轴分析方法进行降维,得到降维图并获得各菌种降维后的坐标位置;
7)菌群互作网络可视化及关键菌种识别:根据步骤6)所得的降维后的菌种位置,在二维图上绘制菌种位置,并根据聚类结果,给菌种进行注释区分,最后根据关联强度,关联方向和前后顺序,绘制菌种间互作关系网络;根据互作关系网络,识别关键菌种。
2.如权利要求1所述的基于时间序列宏基因组数据的动态观测装置,其特征在于,所述检测方法的步骤1)中,时间点大于等于4。
3.如权利要求1所述的基于时间序列宏基因组数据的动态观测装置,其特征在于,所述检测方法的步骤2)中,每个样本所有种水平物种相对丰度加和为100%;低出现频次物种为在5%样本种出现的菌种,低丰度物种为该物种所有样本中第90百分位数小于1的物种;过滤后再进行归一化处理,将肠道菌群相对丰度信息矩阵转成宽格式数据形式,即每行代表一个物种,每列为时间点,列按时间顺序排序;接着,对每个物种进行标准化处理;去除低波动物种,即标准差为0的物种。
4.如权利要求1所述的基于时间序列宏基因组数据的动态观测装置,其特征在于,所述检测方法的步骤3)中,选取其中两个待分析菌种的时间序列,使用动态时间归整分析两个菌种序列间的距离及路径;根据路径对两个菌种序列进行伸缩,根据伸缩后的位置填补丰度信息,获得伸缩后的新序列;相关系数为相似系数、相似大小和相似方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康美华大基因技术有限公司,未经康美华大基因技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010801019.1/1.html,转载请声明来源钻瓜专利网。