[发明专利]检测人体肠道宏基因组的细菌群落及丰度的方法在审

专利信息
申请号: 201410431106.7 申请日: 2014-08-28
公开(公告)号: CN105095688A 公开(公告)日: 2015-11-25
发明(设计)人: 侯涛;刘富;刘云;康冰;张潇 申请(专利权)人: 吉林大学
主分类号: G06F19/24 分类号: G06F19/24;G06F19/22
代理公司: 吉林长春新纪元专利代理有限责任公司 22100 代理人: 白冬冬
地址: 130012 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 检测 人体 肠道 宏基 细菌 群落 方法
【说明书】:

技术领域

发明属于生物信息鉴定领域。

背景技术

人体肠道定植有上百万亿细菌,这占到了人体细菌总量的绝大多数。一旦肠道菌群失调,就会产生一系列疾病。然而,99%的肠道细菌群落都是不能通过传统方法培养的,也就不能通过传统的基因组学方法获取它们的基因信息。宏基因组学技术(Metagenomics),为我们提供了充分挖掘肠道中细菌群落的技术手段,该技术不需要对菌群进行传统培养,而是直接测序肠道样品中的DNA。这种技术测序所得到的不是一种细菌的完整基因组,而是肠道中所有菌群的混杂基因,其中大量是以前无法认识的新细菌。传统的通过生物实验(提取宏基因组中微生物菌株16sRNA)来鉴定DNA片段归属的方法,无论在人力、物力还是时间上都显得力不从心。怎样设计生物信息学方法来检测人体肠道宏基因组中的细菌群落,是需要解决的一个关键问题。

发明内容

本发明的目的是利用已测序细菌的基因组作为参考基因组,基于支持向量数据描述(SVDD)模型检测肠道宏基因组中未知DNA片段细菌群落的检测人体肠道宏基因组的细菌群落及丰度的方法。

本发明的步骤是:

a、利用SVDD模型对已知细菌的DNA序列进行分类训练:从下载的每个细菌中随机切割出100段长度为1000bp的不重叠DNA片段,对每一段DNA片段,计算其k-mer频率与它们的反向互补k-mer频率之商作为数字特征向量;

设每类细菌X能描述为:,其中是从每一段DNA片段中提取的数字特征向量,N是每类细菌的样本数,l是数字特征向量的维数,提取每类细菌X的所有DNA序列片段的数字特征向量之后,利用支持向量数据描述SVDD模型对其进行分类训练,就是在核空间寻求一个包含几乎所有的且体积达到最小的超球体,用来对每类细菌X进行数据描述,所求超球可通过解如下所示的凸约束二次规划得到:

式中:为球心,r为半径,是2-范数,是对称的非线性映射函数,是一个松弛变量;

b、根据分类训练结果检测肠道宏基因组中包含的DNA片段来自的细菌群落及丰度:对每个输入的待检测DNA片段,先计算其数字特征向量x,然后用下面的函数来决定所属细菌群落:

式中、分别是是所训练的第j个细菌群落的超球球心和半径。

本发明所述的基于支持向量数据描述模型的人体肠道宏基因组细菌群落检测,是提取DNA片段的数字特征,即k-mer频率与它们的反向互补k-mer频率组合而成的综合频率,其优势在于不需要生物实验提取细菌的16sRNA作为物种特征标签。本发明所述的方法具有快速、方便的特点。是利用一种有监督的学习方法SVDD模型,对已知细菌的DNA信息进行分类训练,来完成对未知DNA片段细菌群落的检测。最终是要检测肠道宏基因组中的DNA片段来自的细菌群落及相应丰度。

附图说明

图1是本发明检测流程图。

具体实施方式

本发明的步骤是:

a、利用SVDD模型对已知细菌的DNA序列进行分类训练:从下载的每个细菌中随机切割出100段长度为1000bp的不重叠DNA片段,对每一段DNA片段,计算其k-mer频率与它们的反向互补k-mer频率之商作为数字特征向量;

设每类细菌X能描述为:,其中是从每一段DNA片段中提取的数字特征向量,N是每类细菌的样本数,l是数字特征向量的维数,提取每类细菌X的所有DNA序列片段的数字特征向量之后,利用支持向量数据描述SVDD模型对其进行分类训练,就是在核空间寻求一个包含几乎所有的且体积达到最小的超球体,用来对每类细菌X进行数据描述,所求超球可通过解如下所示的凸约束二次规划得到:

式中:为球心,r为半径,是2-范数,是对称的非线性映射函数,是一个松弛变量;

b、根据分类训练结果检测肠道宏基因组中包含的DNA片段来自的细菌群落及丰度:对每个输入的待检测DNA片段,先计算其数字特征向量x,然后用下面的函数来决定所属细菌群落:

式中、分别是是所训练的第j个细菌群落的超球球心和半径。

以下对本发明做进一步详细描述:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410431106.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top