[发明专利]二代测序DNA突变检测的生物信息学分析的方法及系统在审
申请号: | 201710146590.2 | 申请日: | 2017-03-13 |
公开(公告)号: | CN107122626A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 高学鹏;潘峰 | 申请(专利权)人: | 上海海云生物科技有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 201199 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二代 dna 突变 检测 生物 信息学 分析 方法 系统 | ||
1.一种二代测序DNA突变检测的生物信息学分析的系统,其特征在于,包括如下模块:
生物信息分析模块:用于提供满足不同要求的生物分析流程,通过所述生物分析流程对生物信息进行分析;
中间数据转换模块:用于对生物信息分析模块产生的数据进行格式转换,提供符合要求的生物分析数据源;
运行环境配置模块:用于配置不同生物分析流程运行时所有输入文件、输出文件、配置文件、数据文件、临时文件、日志记录、脚本及应用程序的相对路径或绝对路径以及运行相关环境变量;其中,相对路径是指相对于当前工作路径的文件路径;绝对路径是指:相对于操作系统根目录的文件路径。
2.根据权利要求1所述的二代测序DNA突变检测的生物信息学分析的系统,其特征在于,所述生物信息分析模块包括:
检测子模块:用于检查XML中参数和运行环境是否满足要求;
分析代码包装子模块:用于生成被包装的生物信息数据分析代码名称以及输入输出格式,并合成命令行等待调度执行。
3.根据权利要求1所述的二代测序DNA突变检测的生物信息学分析的系统,其特征在于,所述中间数据转换模块还用于调用对应的中间数据转换脚本或代码,对指定类型的数据进行数据格式转换或信息抽提。
4.根据权利要求1所述的二代测序DNA突变检测的生物信息学分析的系统,其特征在于,所述运行环境配置模块还用于读取运行环境配置的XML文件,并初始化所有环境配置,具体地包括:创建文件夹、设置环境变量、拷贝必要数据。
5.一种二代测序DNA突变检测的生物信息学分析的方法,其特征在于,应用权利要求1至4中任一项所述的二代测序DNA突变检测的生物信息学分析的系统,包括如下步骤:
步骤1:按照被包装生物信息分析代码的要求,撰写对应的XML配置文件,通过XML文件描述生物信息分析模块的基本输入输出和运行参数;
步骤2:通过JVM语言创建中间数据转换模块;
步骤3:通过XML文件描述生物信息分析流程运行环境配置,指定运行的环境变量、文件路径。
6.根据权利要求5所述的二代测序DNA突变检测的生物信息学分析的方法,其特征在于,所述步骤1包括:通过组合参数、输入输出数据、包装的代码或脚本生成生物信息分析执行方案。
7.根据权利要求5所述的二代测序DNA突变检测的生物信息学分析的方法,其特征在于,所述步骤2包括:通过中间数据转换模块直接获取一个或多个输入数据,并产生一个或多个转换结果。
8.一种二代测序DNA突变检测的生物信息学分析的方法,其特征在于,包括如下步骤:
基础模块搭建步骤:撰写用于包装生物信息分析基本单元的生物信息分析模块配置文件,生物信息分析基本单元包括:生物信息分析代码或脚本;并撰写中间数据转换模块的代码或脚本;
生物信息分析流程创建步骤:创建生物信息分析流程配置文件,按照生物信息分析模块衔接需要,添加必要的中间数据转换模块,并根据生物信息分析模块和中间数据转换模块配置必须的运行环境配置模块。
9.根据权利要求8所述的二代测序DNA突变检测的生物信息学分析的方法,其特征在于,所述生物信息分析流程创建步骤中创建生物信息分析流程配置文件的方法如下:
1)定义生物信息分析模块;
2)配置生物信息分析模块的执行顺序、并行条件。
10.一种二代测序DNA突变检测的生物信息学分析的方法,其特征在于,应用权利要求1至4中任一项所述的二代测序DNA突变检测的生物信息学分析的系统,包括如下步骤:
步骤1:检查是否有满足当前提交的生物信息分析模块或中间数据转换模块运行的执行队列;若满足,则进行步骤2;若不满足,则返回状态队列错误;
步骤2:在对应执行队列中添加当前提交的生物信息分析模块或中间数据转换模块;
步骤3:检查执行状态以及返回结果;
步骤4:返回用户执行结果或错误信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海云生物科技有限公司,未经上海海云生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710146590.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用