[发明专利]一种基于云计算基因序列数据质控管理方法在审
申请号: | 201811439230.2 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109584958A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 杨文婷;陈亮 | 申请(专利权)人: | 江苏医联生物科技有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B25/00 |
代理公司: | 北京文苑专利代理有限公司 11516 | 代理人: | 朱青 |
地址: | 225000 江苏省扬州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 临床信息 分析 质控 基因序列 基因组学 云计算 转录组 测序 管理 样本 数据管理 外显子测序 靶向区域 测序数据 差异表达 后续分析 基因融合 可变剪切 全基因组 实验过程 实验环节 样本信息 全流程 检测 环节 应用 帮助 | ||
1.一种基于云计算基因序列数据质控管理方法,其特征在于,包括:样本临床信息管理、实验数据管理、数据全流程质控和分析结果管理。
2.根据权利要求1所述的数据质控管理方法,其特征在于,样本临床信息管理的检测项目包括基因组学分析、转录组学分析,基因组学分析包括全基因组测序、全外显子测序和靶向区域测序,检测内容包括碱基替换突变、插入缺失突变、拷贝数变异、结构变异、DNA甲基化、功能注释、通路富集等;转录组学分析包括丰度计算、表达量分析、基因融合、可变剪切、差异表达分析、功能注释和通路富集等,数据覆盖mRNA、microRNA、lncRNA、scRNA的转录测序数据。
3.根据权利要求1-2所述的数据质控管理方法,其特征在于,实验数据管理包括:搭建实验数据库,保存实验信息数据。
4.根据权利要求1-3所述的数据质控管理方法,其特征在于,实验数据库的信息包括:
记录信息包括实验室ID、样本接收日期、实验进度、样本取样体积、引物ID、DNA产量、建库产量、杂交捕获产量、上机量、样本存放位置、操作人、实验结果、备注;
实验进度阶段包括:样本接收、核酸、建库、上机、分析、已完成;实验进度阶段会实时更新。
5.根据权利要求1-4所述的数据质控管理方法,其特征在于,数据全流程质控包括:接收到原始数据后,对原始数据进行校验质控,然后对原始数据预处理、与参考基因组进行测序数据比对、产生变异检测结果各个环节都进行相应的质控。
6.根据权利要求1-5所述的数据质控管理方法,其特征在于,对原始数据的校验质控包括:分析前对原始数据进行校验,确保数据无误,然后对原始数据进行质控,检测测序效果以及数据质量,包括序列数、测序量、碱基质量、重复序列等。
7.根据权利要求1-6所述的数据质控方法,其特征在于,对原始数据预处理环节的质控包括:在开始分析前,对数据进行预处理,过滤出干净而有效的序列数据,预处理结束后,对预处理后的数据会在此进行质控,并且将预处理前后两次质控结果进行对比,提供表格数据结果和图形化结果。
8.根据权利要求1-7所述的数据质控方法,其特征在于,与参考基因组进行测序数据比对结果的质控包括:对经过预处理的测序数据进行分析,第一步是基于参考基因组对测序数据进行比对,将测序数据与参考基因组进行比对,比对上的序列则为有效序列,用于后续分析,无法比对的序列则是无效序列;比对后生成BAM文件,对BAM文件进行质控。
9.根据权利要求1-8所述的数据质控方法,其特征在于,变异检测结果的质控包括:将测序数据进行比对后,生成BAM文件,基于参考基因组,从BAM文件中寻找出与参考基因序列不同的位点信息,以差异序列所在位置为单位,每个差异位点表示一个变异,将所有的变异信息进行整合,生成VCF文件,对VCF结果进行质控。
10.根据权利要求1-9所述的数据质控方法,其特征在于,分析结果管理包括:对原始测序数据进行处理,生成包含变异结果的VCF文件;基于VCF中的数据进行深入分析,从中挖掘出有用的数据结果;后续分析包含差异表达分析、通路富集分析、拷贝数检测、结构变异分析、DNA甲基化分析等;经过一系列分析后得到的结果为最终分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏医联生物科技有限公司,未经江苏医联生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811439230.2/1.html,转载请声明来源钻瓜专利网。