[发明专利]宏基因组数据分析及特征菌筛选方法在审
申请号: | 202111246832.8 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114023386A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 郑明权;侯晓帆;刘裕 | 申请(专利权)人: | 艾德范思(北京)医学检验实验室有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/00 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宏基 数据 分析 特征 筛选 方法 | ||
1.宏基因组测序数据分析和/或特征菌群鉴定方法,其特征在于:所述方法包括如下步骤:对所有待测样本的宏基因组原始数据进行预处理获得每个待测样本的高质量数据;对所述高质量数据进行微生物组组成分析获得所述每个待测样本的细菌的组成及相对丰度分布结果;对所述细菌的组成及相对丰度分布结果进行细菌谱构成比较得到所述每个待测样本的细菌谱构成结果;对所述细菌谱构成结果进行特征菌群分析,得到所述每个样本的特征菌群;对所述细菌谱构成结果进行特征菌群鉴定,得到所述待测样本之间的差异基因和特征菌群;
所述特征菌群鉴定的过程包括:使用随机森林方法建立特征菌群分类模型,通过所述特征菌群分类模型获得所述待测样本分组间的特征菌群和差异基因。
2.根据权利要求1所述的方法,其特征在于:所述使用随机森林方法建立特征菌群分类模型的过程包括如下步骤:随机选取80%的所述待测样本作为训练集,20%的所述待测样本作为测试集,使用所述训练集构建所述特征菌群分类模型,使用所述测试集验证所述特征菌群分类模型;对所述特征菌群分类模型绘制ROC曲线,使用AUC值确定所述特征菌群分类模型的准确性。
3.根据权利要求1或2所述的方法,其特征在于:所述特征菌群分析包括α多样性分析和β多样性分析;
所述α多样性分析使用物种Chao1丰富度指数和/或Shannon指数描述所述待测样本的微生物物种多样性;
所述β多样分析包括如下步骤:采用Bray-Curtis不相似系数进行度量,采用主坐标分析方法和非度量多维尺度分析方法分析所述待测样本的微生物组的整体变异。
4.宏基因组数据分析装置,其特征在于:所述装置包括如下模块:
(1)数据预处理模块:用于将所有的待测样本的宏基因组数据进行质量控制和过滤得到高质量数据;
(2)微生物组组成分析模块:用于基于所述高质量数据分析每个所述待测样本的微生物群体中种水平精度的组成和相对丰度,得到每个所述待测样本的细菌的组成及相对丰度分布结果;
(3)细菌谱构成比较模块:用于基于所述细菌的组成及相对丰度分布结果获得每个所述待测样本的细菌谱构成结果;
(4)特征菌群分析模块:用于基于所述细菌谱构成结果得到每个所述待测样本的特征菌群;
(5)特征菌群鉴定模块:用于基于所述细菌谱构成结果获得每个所述待测样本分组间的特征菌群和差异基因;
所述特征菌群筛选模块通过包括如下步骤的方法建立:利用随机森林方法建立所述待测样本的特征菌群分类模型,通过所述特征菌群分类模型获得所述待测样本分组间的特征菌群和差异基因。
5.根据权利要求4所述的装置,其特征在于:(4)中所述特征菌群分析模块包括如下模块:
(4-1)α多样性分析模块:用于获得每个待测样本微生物组的整体变异;通过包括如下步骤的方法建立:采用物种Chao1丰富度指数和Shannon指数描述所述待测样本的微生物物种多样性;采用Wilcoxon rank-sum检验进行待测样本分组间的比较;
(4-2)β多样性分析模块:用于获得每个待测样本微生物组的整体变异;通过包括如下步骤的方法建立:采用Bray-Curtis不相似系数进行度量;采用主坐标分析方法和非度量多维尺度分析方法分析。
6.宏基因组数据特征菌筛选装置,其特征在于:所述装置包括权利要求5中所述的特征菌群筛选模块。
7.存储有计算机程序的计算机可读存储介质,所述计算机程序使计算机运行如权利要求1-3中任一权利要求所述方法的步骤或所述计算机程序使计算机运行如权利要求4-6中任一权利要求所述装置或权利要求7中所述装置的模块。
8.存储有计算机程序的计算机可读存储介质,所述计算机程序使计算机建立如权利要求1-3中任一权利要求所述方法的步骤或所述计算机程序使计算机建立如权利要求4-6中任一权利要求所述装置或权利要求7中所述装置的模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾德范思(北京)医学检验实验室有限公司,未经艾德范思(北京)医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111246832.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置