[发明专利]一种基于人肠道菌群的自动化分型方法在审
申请号: | 202010313064.2 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111524555A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 王树伟;肖云平;史贤俊;林博;张建明 | 申请(专利权)人: | 上海欧易生物医学科技有限公司 |
主分类号: | G16B40/30 | 分类号: | G16B40/30 |
代理公司: | 苏州中合知识产权代理事务所(普通合伙) 32266 | 代理人: | 刘召民 |
地址: | 201114 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 肠道 自动 化分 方法 | ||
本发明公开了一种基于人肠道菌群的自动化分型方法,采用LEfSe方式对聚类结果分组进行Biomarker筛选,然后确定具体肠型,结果全面,包含涉及到的聚类图、Biomarker筛选、肠型boxplot图展示,可自动整理所有分析结果,每一步分析完成之后自动对结果进行汇总统计,可视化,而且,所有操作步骤可以溯源,方便错误查询,如果分析报错,会有对应的报错日志信息。
技术领域
本发明涉及高通量微生物测序领域,具体涉及一种基于人肠道菌群的自动化分型方法。
背景技术
2011年一家欧洲的科研机构利用一个细菌基因的差异性对22名欧洲人肠道微生物的组成情况进行了分析,鉴别出了每个人之间以及同一个人体内微生物生态组不同的组成情况。并且,他们还将这些欧洲人的微生物生态组组成模式和早前发现的日本人和美国人的微生物生态组组成模式进行了比对。结果却发现这些微生物生态组并不是随机组合而成的,微生物生态组在所有这些受检人群中大致可以分为三种类型,又称作肠道型(Enterotype),科学家们将它们具体分为拟杆菌型(Bacteroides)、普氏菌型(Prevotella)和瘤胃球菌型(Ruminococcus),意指它们分别含有较多的拟杆菌、普氏菌或瘤胃球菌。对更大规模的人群(154名美国人和85名丹麦人)进行调查也得到了同样的结论,他们同样可以分为这三种类型,这说明其实在我们人体的肠道内真正存活得非常好的微生物生态组可能数量并不太多。
2011年4月,MetaHIT联盟发表了在人体肠道微生物群中发现肠型(Arumugam,Raes等,2011)。相关研究的数据是公开的,在文章的补充信息中解释了计算过程背后的理论。然而,附录中并没有报道(在R环境中)能够让任何人复制文章中所有数据的确切命令集和具体的肠型鉴定方法及完整的可视化展示。
现有肠型鉴定存在如下缺陷:
(1)肠型鉴定不明确:每个聚类结果的肠型鉴定方法不明确;
(2)结果展示不完整:分析结果过于简单,数据挖掘得不够深入,缺少数据对应的可视化展示内容。
发明内容
为了克服现有技术所存在的缺陷,本发明的目的在于提供一种基于人肠道菌群的自动化分型方法。
为了实现上述目的,本发明所采用的方案是:
一种基于人肠道菌群的自动化分型方法,包括如下步骤:
1)准备所有样品的属水平物种相对丰度表;
2)通过环绕中心点分割算法(PAM)进行分区,对丰度分布进行聚类,并使用Calinski-Harabasz(CH/卡林斯基-哈拉巴斯)指数筛选最佳聚类个数;
3)通过轮廓验证技术对聚类效果进行验证;
4)根据最佳聚类个数进行BCA类间分析;
5)通过LEfSe分析筛选出每组中对差异贡献最大的物种作为每个组的肠型,
并绘制boxplot图。
优选地,步骤2)中,Calinski-Harabasz指数定义为:
其中Bk是聚类间平方和,Wk是聚类内平方和,选择使CKk值最大的k簇的数目。
优选地,步骤3)中,各数据点i的轮廓宽度S(i)由下式计算:
其中a(i)是样本i与同一簇中所有其他样本的平均差值(或距离),b(i)是样品i与最近簇中所有对象的平均差值(或距离),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海欧易生物医学科技有限公司,未经上海欧易生物医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313064.2/2.html,转载请声明来源钻瓜专利网。