[发明专利]一种高效的针对于放线菌基因组拼接的方法在审
申请号: | 201611005096.6 | 申请日: | 2016-11-15 |
公开(公告)号: | CN106778076A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 肖岚;叶伟星;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/16 |
代理公司: | 上海天翔知识产权代理有限公司31224 | 代理人: | 吕伴 |
地址: | 200231 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 针对 放线菌 基因组 拼接 方法 | ||
技术领域
本发明属于生物信息学范畴,涉及基因组拼接领域,尤其涉及一种高效的针对于放线菌基因组拼接的方法。
背景技术
放线菌为原核生物中的一个类群,属于革兰氏阳性细菌,因其菌落呈放射状而得名。
放线菌大部分是腐生菌,普遍分布于土壤中,一般都是好气性,有少数是和某些植物共生的,也有是寄生菌,可致病,寄生菌一般是厌气菌。放线菌有一种土霉味,使水和食物变味,有的放线菌也能和霉菌一样使棉毛制品或纸张霉变。放线菌主要能促使土壤中的动物和植物遗骸腐烂。放线菌中也有致病菌,如牛放线菌,在口颊、齿龈等部位发生损伤时能侵入组织内,引起放线菌病。最主要的致病放线菌是结核分枝杆菌和麻风分枝杆菌,可导致人类的结核病和麻风病。
放线菌最重要的作用是可以产生、提炼抗菌素,目前世界上已经发现的2000多中抗菌素中,大约有56%是由放线菌(主要是放线菌属)产生的,如链霉素、土霉素、四环素、庆大霉素等都是由放线菌产生的。此外有些植物用的农用抗菌素和维生素等也是由放线菌中提炼的。放线菌在甾体的转化、石油的脱蜡、污水的处理等方面也有广泛的用途,在自然界的氮素循环中也起着一定的作用。
目前通过分子生物学方法,放线菌的地位被肯定为广义细菌的一个大分支。放线菌用革兰氏染色可染成紫色(阳性),和另一类革兰氏阳性菌——厚壁菌门相比,放线菌的GC含量较高,可至70%。
放线菌基因组的研究有利于在基因层面揭示其生理生化特征及代谢规律,无论在疾病防治还是代谢产物改造等方面有着重要的生物学意义。目前常用的第二代高通量测序平台,如Illumina Hiseq或者Miseq,采用边合成边测序的方式,测序中引入有PCR过程,获得的是基因簇的整体荧光信号,因而单碱基准确率较高(99%以上),但其易受序列GC和AT含量的影响,GC含量太高或太低都无法获得较好的测序结果,对后续基因组拼接产生不利影响,且读长较短,一般为几百bp。
鉴于放线菌基因组中较高的GC含量,仅仅采用二代测序平台是无法获得较好的拼接结果的。第三代测序又称为单分子测序技术,以PacBio RSⅡ平台为例,其不同于第二代测序得到整体信号的测序方式,不涉及PCR扩增过程,无碱基偏好性,且读长更长,有利于跨过高GC区域以及重复区域,但其单碱基准确率不高,为90%左右。
如何利用现有测序手段,发挥各平台的优势以获得完整的放线菌基因组拼接结果是我们需要解决的问题。
发明内容
鉴于上述现有技术的不足,本发明提供一种高效的针对于放线菌基因组拼接的方法,旨在解决如何得到较为完整的放线菌基因组拼接结果的问题。
本发明所采用的技术方案如下:
一种高效的针对于放线菌基因组拼接的方法,其中包括步骤:
步骤A、采用第三代测序平台对放线菌进行建库测序;
步骤B、采用第二代测序平台对放线菌进行建库测序;
步骤C、对第三代测序平台的下机数据进行拼接;
步骤D、对第二代测序平台的下机数据进行拼接;
步骤E、对两个平台的拼接结果进行共线性分析以得到各序列之间的连接关系,依赖该连接关系对序列进行连接;
步骤F、利用第二代测序平台下机数据对连接结果进行校正。
在本发明的一个优选实施例中,所述步骤A中,所述第三代测序平台为PacBio RSⅡ。
在本发明的一个优选实施例中,所述步骤B中,所述第二代测序平台为Illumina MiSeq。
在本发明的一个优选实施例中,所述步骤C中,所述拼接软件为SMRT Analysis。
在本发明的一个优选实施例中,所述步骤D中,所述拼接软件为Newbler。
在本发明的一个优选实施例中,所述步骤E中,共线性分析软件为MUMMER。
在本发明的一个优选实施例中,所述步骤F中,所述序列校正软件为pilon。
本发明通过结合第三代测序和第二代测序的优势,得到了较完整的放线菌基因组拼接结果,为揭示其生理生化特征及代谢规律提供基因组学基础。
附图说明
图1 MUMmer分析比对结果示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供的一种高效的针对于放线菌基因组拼接的方法,其中包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611005096.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用