[发明专利]在项目分析流程中自动建立数据库的方法及系统有效
申请号: | 201410742443.8 | 申请日: | 2014-12-08 |
公开(公告)号: | CN104484375B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 苏海桥;唐启覃;周良风;窦文祥;蔡雄颖;邹利君;陈勇;刘娜;梁绍光;李国庆 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/00 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 梁顺宜,郝传鑫 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 项目 分析 流程 自动 建立 数据库 方法 系统 | ||
技术领域
本发明涉及生物信息分析领域,尤其涉及一种在项目分析流程中自动建立数据库的方法及系统。
背景技术
随着生命科学领域实验技术的快速发展,科学仪器的自动化、智能化水平日益提高,数据产出能力有了质的飞跃。同时,生命科学研究对分析测试的要求无论在样品数量、分析周期、分析项目和数据准确性等方面都提出了更高的标准和要求,生物实验室产出的信息呈几何级数增长。
在传统的生物实验室中,由于数据类型多样、格式不一,数据的保存、交换、查询、分析、维护都很不方便,严重阻碍了研究人员之间的信息提交。在生物信息学中涉及到的多种实验流程中,需要手动跑每一个建库的流程,配置两个脚本的参数,然后投任务。不仅过程繁琐,而且不利于数据库的管理。需要手动。
发明内容
本发明的目的提供一种在项目分析流程中自动建立数据库的方法和系统,将建库纳入到流程之中,直接选择就可接入流程,而且方便管理建好的数据库。
本发明提供了一种在项目分析流程中自动建立数据库的方法,包括步骤:
步骤一:创建项目并存于业务管理系统中,每个项目包括多个子项目;并选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项目和标准化子项目;
步骤二:当所述子项目的类型为标准化子项目时,则该子项目对应的样品在经测序仪测序的同时,对该样品创建包括过滤分析、表达谱定量分析、差异比较分析、Cluster聚类分析、靶基因预测分析、KOGO分析和碱基编辑分析中的一种或多种的标准流程分析,且在创建每个标准流程分析过程中由用户选择建立的数据库以及根据当前子项目的样品情况、测序类型、分析目的向数据库输入对应的比对参数;经测序仪测序完成后,根据所述数据库中的比对参数对每一样品数据进行过滤,从而去掉不符合比对参数的样品数据;然后再运用所创建的标准流程分析对符合比对参数的每一样品数据进行分析,从而生成分析结果,分析结果包括子项目信息和对应的样品信息;
步骤三:对所述分析结果进行质控,若质控通过,则直接输出该分析结果;若质控不通过,且所述分析结果和质控标准的差距在阈值范围内,则重新编辑所述样品数据或过滤/质控参数后再次进行步骤二的过滤与分析过程,直至分析结果通过质控;若质控不通过,且所述分析结果和质控标准的差距超过阈值,则编辑所述样品且废弃相关Lane,并在所述业务管理系统中重新下单。
作为上述技术方案的改进,还包括步骤:当所述子项目的类型为只过滤子项目,则根据选择的子项目类型和任务信息,依次从下机数据管理系统中获取对应的且经过测序仪测序后的样品数据;且每获取一个样品数据,即根据预设的参数配置运用统一的过滤标准进行过滤与分析,从而过滤不符合参数配置的样品数据;且待获取的所有样品数据过滤与分析完后,生成分析结果,分析结果包括子项目信息和对应的样品信息。
作为上述技术方案的改进,可供用户选择建立的所述数据库为个人数据库,包括Genome数据库和targerGene数据库;供用户选择建立的每一所述数据库且需要用户输入的比对参数包括:数据库名称、参考基因组路径、Repeat区域文件、外显子/内含子、Ncgb物种名称、和比对mirbase物种。
作为上述技术方案的改进,对于供用户选择建立完成后的每一所述数据库,可供用户进行比对参数修改及删除的操作。
作为上述技术方案的改进,每个子项目的概要信息包括子项目代码、子项目名称、子项目类型、是否是只过滤、总的样品数、执行人、开始时间和结束时间、子项目状态以及子项目相关操作;所述样品信息包括样品名称、文库名称、Lane ID、测序策略、Flowcell ID、Raw data、Raw Reads、Read Length、GC%、Q20%、Q30%、Error Rate、碱基分布图以及碱基质控分布图。
本发明还一种在项目分析流程中自动建立数据库的系统,包括创建单元、第二过滤分析单元、质控单元和数据库:
所述创建单元用于创建项目并存于业务管理系统中,每个项目包括多个子项目;并选择所述创建项目中的子项目和任务信息;所述子项目的类型包括只过滤子项目和标准化子项目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410742443.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:替换词典生成方法及装置
- 下一篇:基于输入法的网站信息提供方法和装置