[发明专利]利用转录组数据获取岷县龙胆叶绿体基因组序列的方法在审
申请号: | 201810008272.4 | 申请日: | 2018-01-04 |
公开(公告)号: | CN110021356A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 高庆波;迟晓峰;张发起;王文娟;陈世龙;李彦;王久利 | 申请(专利权)人: | 中国科学院西北高原生物研究所 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 810008 青海省*** | 国省代码: | 青海;63 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 叶绿体基因组 龙胆 转录组 比对 拼接 数据获取 组装 二代测序技术 比对数据库 叶绿体基因 比对结果 参考序列 测序技术 序列组装 原始数据 重要信息 龙胆属 重叠区 测序 成环 首尾 过滤 排序 填补 检查 开发 | ||
本发明公开了一种利用转录组数据获取岷县龙胆叶绿体基因组序列的方法,通过二代测序技术获得岷县龙胆的转录组测序原始数据,经过过滤以及与已知的龙胆属叶绿体基因组进行比对,筛出叶绿体基因reads,将筛出的reads组装成叠连群,其后将叠连群建成本地比对数据库,与参考序列比对,根据比对结果排序和拼接,每拼接5—6kb,将新组装的序列与其它叶绿体基因组序列进行比对,以检查所拼接的序列,最后根据首尾的重叠区将序列组装成环,再通过PCR和一代测序技术填补其中的间隙,最终获得岷县龙胆的叶绿体基因组序列。本发明有利于了解岷县龙胆叶绿体基因组结构等重要信息,也进一步地开发了转录组数据的价值。
技术领域
本发明涉及生物科学领域,具体涉及利用转录组数据获取岷县龙胆叶绿体基因组序列的方法。
背景技术
获取叶绿体基因组序列对研究绿色植物的光合作用等能量代谢过程以及研究物种的系统发育等有重要意义;目前常用的获取叶绿体基因组序列的方法有三种:①提取纯净的叶绿体DNA,然后通过测序获得,该方法对实验材料要求较高且实验难度大,②利用通用引物通过长片段PCR方法将植物总DNA中的叶绿体DNA扩增出来,然后通过测序获得,但该方法所用的引物往往不具有广泛的通用性,导致许多植物类群的叶绿体DNA并不能完整扩增,③直接对植物总DNA进行测序,然后通过生物信息学的方法将其中的叶绿体DNA筛选出来,然后通过拼接组装获得,然而该方法的测序结果中,非叶绿体DNA(核DNA和线粒体DNA)序列往往会占据极大部分的数据量,导致实验成本偏高。
转录组在细胞表型和功能、基因结构、基因功能、基因表达以及分子标记开发等领域有重要研究价值,因而在过去的相关研究工作中产生了大量的植物转录组数据;中国科学院昆明植物研究所的高立志研究组研究表明,植物的整个叶绿体基因组能发生全转录;如果能从转录组数据中将来自叶绿体的RNA序列全部筛选出来,然后经过拼接组装形成全转录组闭合环状序列,该闭合环状序列即可代表相应物种的叶绿体基因组序列,这必然可以让我们获得叶绿体基因组的大量信息,也可以进一步的发掘转录组数据的价值。
发明内容
针对现有技术的不足之处以及现在已经存在大量转录组数据的事实,本发明旨在提供一种充分发掘转录组数据价值以及获得叶绿体基因组序列的方法。
本发明方法具体通过以下技术方案实现:
利用转录组数据获取岷县龙胆叶绿体基因组序列的方法,包括以下步骤:
1)利用高通量测序技术对相应植物叶片的转录组样品进行测序;
2)过滤掉冗余的、不理想的与非目标数据,从而获得转录组的有效数据(clean data);
3)从clean data中筛选出能定位到参考叶绿体基因组上的reads;
4)组装步骤(3)所获得的reads,构建叠连群(contigs);
5)根据参考基因组对叠连群进行排序以及进一步的拼接和组装;
6)每拼接5—6kb则将新拼接的序列与已知的核酸序列进行blast,以检查所拼接的序列;
7)合并首尾序列的重叠部分,获得环状序列;
8)如果存在间隙(gaps),则根据gaps两端序列设计引物对gap进行PCR,通过一代测序法获得gap区序列以填补gap,从而获得完整的叶绿体基因组序列;
进一步的,
步骤(3)选取选取与样本物种亲缘关系近的物种的叶绿体基因组序列作为参考叶绿体基因组序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院西北高原生物研究所,未经中国科学院西北高原生物研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810008272.4/2.html,转载请声明来源钻瓜专利网。