[发明专利]一种基于BSA基因定位的自动化分析方法在审
申请号: | 201811083678.5 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109378038A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 王萌 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B20/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动化分析 基因定位 数据处理步骤 数据处理效率 服务器使用 全自动分析 定位结果 基因区域 结果整理 原始数据 校验 性状 关联 语言 展示 | ||
本发明公开的一种基于BSA基因定位的自动化分析方法,具体包括如下步骤:1)原始数据准备步骤;2)准备数据的校验及导入步骤;3)数据处理步骤;4)结果整理步骤。本发明是基于Linux shell语言的BSA基因定位自动化分析方法,可对下机数据全自动分析,提高数据处理效率和服务器使用效率,最终得到与特定性状关联的基因区域,并提供丰富的定位结果展示图表。
技术领域
本发明涉及生物检测技术领域,特别涉及Illumina测序数据分析技术领域,具体是指一种基于BSA基因定位的自动化分析方法。
背景技术
高通量测序技术为人们利用分子生物学手段研究自然界的规律提供了更多可行性方案。目前众多高通量测序技术都有相关的分析方法或分析流程作为参考帮助科研人员进行高通量数据处理。
混合分组分析(BSA)是一种将多个相同遗传背景个体的DNA混合后测序,然后通过计算混合DNA池中变异位点(通常为SNP)的变异频率,以定位与特定性状相关的基因区域的方法。BSA法克服了很多作物难以得到近等基因系的限制,比近等基因系法省时省力,并且有测序费用较低的优势,目前已在基因定位研究上被大量应用。
但是,目前现有BSA分析方法具有测序结果不够可靠,流程复杂,测序样本单一等缺陷。现有流程中变异检测程序所应用的不是主流基因测序软件,变异检测结果与主流软件有一定差异性,且现有流程中需经过数轮变异检测过程,耗费时间。另外,其受测序材料的限制,原有流程只能处理单一亲本的项目。
发明内容
为了解决现有技术所存在的上述问题,本发明所提供的一种基于BSA基因定位的自动化分析方法。
本发明所要解决的技术问题可以通过以下技术方案来实现:
一种基于BSA基因定位的自动化分析方法,包括如下步骤:
1)原始数据准备步骤
包括准备fasta格式的参考基因组序列,以及遗传群体各样本的测序原始下机数据;
2)准备数据的校验及导入步骤
进入Linux环境,检测准备文件是否齐全,后从存储数据的服务器调取参考基因组序列及测序的下机数据;
3)数据处理步骤
包括对下机数据质控过滤、比对参考基因组、变异检测、SNP-index计算、候选区域定位及绘图;
4)结果整理步骤
对得到的结果进行分类整理,包括参考基因组信息、测序数据质量及数据量信息、比对结果统计、SNP-index统计结果、定位结果图表进行分析。
由于采用了如上的技术方案,本发明具有如下几点主要创新点:
将变异检测步骤改用主流软件来操作,提高了该步骤的结果可靠性。
简化方法流程,且只需检测一次,节约分析时间,减少人工操作压力,提高服务器使用效率。
应用新的变异频率计算思路,丰富了结果的图形展示部分,使结果便于发表。基于Linux shell的BSA基因定位自动化分析方法,可对下机数据全自动分析,提高数据处理效率和服务器使用效率,并对结果展示进行了优化。
本流程弃用原流程的比对思路,基于非亲本的参考基因组直接检测双亲和双子代混池的群体变异信息,解决原流程只能处理单一亲本的问题,丰富了流程的使用范围,并简化了流程。
附图说明
图1为本发明的BSA基因定位自动化分析方法流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811083678.5/2.html,转载请声明来源钻瓜专利网。