[发明专利]一种病原微生物基因组快速分析方法及系统有效
申请号: | 201510932914.6 | 申请日: | 2015-12-15 |
公开(公告)号: | CN106886689B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 阮陟;陈欢;冯晔;单杲 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/28 |
代理公司: | 北京市盈科律师事务所 11344 | 代理人: | 刘立国 |
地址: | 310003*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种病原微生物基因组快速分析方法及数据分析平台;该方法在菌株数据库系统的基础上提供了基于细菌基因组序列的分型与溯源功能,用户只需作简单的参数设置并上传菌株的基因组序列,系统将在极短的时间内反馈该菌株的MLST分型结果、耐药与毒力基因分布、参考菌株名称并提供用户上传菌株与数据库中所有菌株间的系统发生树。该方法适用于建立一个整合遗传学、基因组学和系统发育学研究的病原微生物学数据分析平台。与现有的分型技术相比,分辨率更高,能更准确区同一克隆的菌株;结果反馈速度快,采用高效的参考菌株设定与基因组SNP序列映射技术,用户可快速获得数据分析结果,便于病原微生物克隆传播的实时跟踪与快速溯源。 | ||
搜索关键词: | 一种 病原微生物 基因组 快速 分析 方法 系统 | ||
【主权项】:
1.一种病原微生物基因组快速分析方法,其特征在于,包括以下步骤:S1:获取细菌菌株的基因组序列数据与临床资料信息并建立BWGT数据库;S2:根据BWGT数据库确定菌株基因组序列所对应的物种及其相应的MLST分型方案,并构建MLST数据库;S3:根据物种与MLST分型方案在MLST数据库中通过BLAST序列比对分析得到基于菌株基因组序列的序列型及其所属克隆复合体信息,并设定具体的参考菌株;所述BWGT数据库中设置有细菌菌株的参考菌株的相关信息;根据基因组序列信息确定基因组序列的分型组;所述基因组序列中的等位基因型超过预设数量的判定为一个分型组;从分型组中确定克隆复合体;所述分型组中的序列型达到预设个数的判定为一个克隆复合体;将所述序列型通过BURST算法绘制出网络结构的辐射状图,具体过程如下:限定7个等位基因型中有5个或5个以上相同的属于一个分型组,并构建进化关系网络图;如果1个分型组中包含4个或4个以上序列型,则为1个克隆复合体;对于每个克隆复合体,通过BURST算法计算出一个在进化关系上被认为是祖先的序列型,作为起源,并将该祖先的序列型作为该克隆复合体的名称;将克隆复合体中的其他序列型表示从祖先的基础上进化而来,二者之间通过1条直线相连,直线的长度则表示亲缘关系的远近;在每个克隆复合体中选取一株细菌作为参考菌株;S4:获取菌株的基因组SNP序列与亲缘关系数据;S5:绘制基于细菌基因组SNP序列的系统发生树;还包括以下步骤:S6:将菌株临床资料、参考菌株、基因组SNP序列和系统发生树信息存储到BWGT数据库;所述BWGT数据库至少包括以下信息:依照不同物种进行划分的病原微生物基因组序列及其编码蛋白与结构域的注释;各物种对应的多位点序列分型方案、等位基因序列、序列型与等位基因型对应关系表;菌株临床资料信息及其与公共数据库的链接;用于基因组分型的参考菌株信息;与参考菌株基因组序列进行BLAST比对与多序列联配后,生成的基因组SNP数据;用户提交的菌株临床信息及其基因组SNP数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510932914.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用