[发明专利]一种生物多样性自动分析方法有效
申请号: | 201810066740.3 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108388771B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 孙伟清;傅延;冯羽佳;张虎 | 申请(专利权)人: | 安徽微分基因科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B50/00 |
代理公司: | 安徽申策知识产权代理事务所(普通合伙) 34178 | 代理人: | 梁维尼 |
地址: | 238014 安徽省合肥市巢湖经济开发区龙泉路*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物多样性 自动 分析 方法 | ||
本发明公开了一种生物多样性自动分析方法,其具体分析步骤如下:步骤一:引物24对,包含与illumina测序芯片匹配的序列、8碱基index序列、测序引物序列、差异序列、通用扩增引物序列,通过PCR反应得到上机测序的文库,并选择对应的测序模式;步骤二:下机数据bcl2fastq软件转化成fastq格式,并加参数“‑create‑fastq‑for‑index‑reads”;步骤三:通过过滤软件BBDuk软件包,使用Phred算法截取低质量序列;步骤四:使用QIIME包中的脚本对拼接好的Tags序列进行二次过滤。本发明压缩项目周期,改进了建库方法,数据过滤的方法和软件,有效降低嵌合体和测序错误带来的分析偏差,而且,即便由于微生物多样性项目,也能从数据生产到过滤成cleantags过程统一做,不用区分每个项目,节约了处理时间。
技术领域
本发明涉及生物多样性分析领域,特别涉及一种生物多样性自动分析方法。
背景技术
微生物多样性分析项目,样本数量多,建库周期长,每个样品的数据量不均衡,过滤标准不一,且聚合酶链式反应(PCR)过程中会出现嵌合体,容易影响后续分析,而且,随着微生物分析数据量不断增大,标准分析流程日趋成熟,对如何能有创新性、快速、高效、可视化进行标准流程分析,更深入的进行个性化分析已经成为一个挑战。
因此,发明一种生物多样性自动分析方法来解决上述问题很有必要。
发明内容
本发明的目的在于提供一种生物多样性自动分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种生物多样性自动分析方法,其具体分析步骤如下:
步骤一:24对引物包含与illumina测序芯片匹配的序列、8碱基index序列、测序引物序列、差异序列、通用扩增引物序列,通过PCR反应得到上机测序的文库,并选择对应的测序模式;
步骤二:将下机数据使用bcl2fastq软件转化成fastq格式,并向转化后的格式文件中加参数“-create-fastq-for-index-reads”;
步骤三:通过过滤软件BBDuk软件包,使用Phred算法截取低质量序列;
步骤四:使用QIIME包中的脚本对拼接好的Tags序列进行二次过滤,将得到的有效序列用于后续分析,使结果更加准确,并得到所有样品的fasta文件;
步骤五:由于设计引物的时候加入了差异序列,因此,用cutadapt软件包对所有样品的fasta文件进行过滤,把测序引物和差异序列截掉;
步骤六:综合使用usearch、vsearch软件对Tags序列进行OTU聚类;
步骤七:使用Greengene数据库对OTU进行注释,并进行后续分析。
优选的,所述步骤一中的文库带有双端index,所述测序模式选择251,8,8,251模式。
优选的,所述步骤二中的下机数据bcl2fastq软件自带的自动化脚本为perl/data/wqsun/perl/Bcl2fastq/bcl2raw_fastq.pl-i-oout_raw-pmiseq-t12。
优选的,所述步骤四中的有效序列为split_libraries_fastq.py-i$out_dir/barcodefile/reads.fastq-b$out_dir/barcodefile/barcodes.fastq-m$out_dir/mapping.txt-barcode_type16-o$out_dir/03.split_libraries_fastq/。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽微分基因科技有限公司,未经安徽微分基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810066740.3/2.html,转载请声明来源钻瓜专利网。