[发明专利]病原体基因组序列数据库系统无效
申请号: | 201110348760.8 | 申请日: | 2011-11-08 |
公开(公告)号: | CN103093123A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 张鑫磊;蒋小云;肖琛 | 申请(专利权)人: | 北京健数通生物计算技术有限公司 |
主分类号: | G06F19/28 | 分类号: | G06F19/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100101 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病原体 基因组 序列 数据库 系统 | ||
技术领域
本发明主要涉及到一个统一了几种不同类型的病原体序列信息的数据库系统,并在此基础上发展的一个对病原体进行遗传学、基因组学和系统发育研究的分析平台。所涉及到的病原体主要包括:细菌、真菌、病毒、原生动物、寄生虫。
背景技术
病原体(pathogen)是能引起疾病的微生物和寄生虫的统称。其中微生物占绝大多数,包括病毒、衣原体、立克次体、支原体、细菌、螺旋体和真菌。高致病性病原体的感染与爆发能给人类造成巨大的伤害,如近年来新发现的一个高致病性的禽流感病毒H5N1造成了100多人的死亡并使得在亚洲、欧洲和非洲数以百万计的禽类被屠宰(世界卫生组织报道),而对高致病性病原体迁移和进化模式进行严谨的监视和跨学科研究是防止人类和其他物种被伤亡的关键。病原体的基因组序列给我们提供了很多可用于病原体发病机理研究、诊断和治疗上的有效信息。现阶段在世界范围内有许多的基因组序列信息数据库,如美国国家生物技术信息中心(NCBI)内的RefSeq数据库和EMBL中的Ensembl Genomes库中提供了很多分类的基因组DNA序列和注释信息,但是,由于在这两个数据库中的有些数据是来源于直接提交上去的序列信息,所以对这些数据库中的病原体基因组序列数据进行提取、校正、确证和分类,建立一个专门的包含病原体基因组序列数据库是非常必要的。
在病原体检测诊断方面,目前临床上常用的病原微生物检测诊断方法有PCR技术、培养技术、免疫酶技术(EIA)、酶联免疫吸附试验(ELISA)等。这些技术在临床诊断中已发挥了巨大的作用,但仍存在一些缺点。虽然PCR技术本身的优越性是无可厚非的,但由于使用不当,很容易引起交叉污染,出现假阳性,如果反应条件控制不好也可能出现假阴性;培养技术繁琐而费时;免疫技术大多需要在抗体出现后才能确定病原微生物。这些缺点需要利用一种新的技术去弥补。随着病原微生物基因组计划的进展,使基因诊断病原微生物感染成为可能,近几年发展起来的生物芯片技术为病原微生物诊断提供了一种强有力的手段。生物芯片技术和其他检测诊断技术相比有许多优点,如高通量、快速、准确、灵敏和对未知病原体的可检测性等。在生物芯片的设计中,从病原体基因组序列出发,进行探针设计,中间往往需要对基因组序列信息进行大量复杂的处理,如提取、校正和分析等,这些过程往往给探针设计增加了一些不必要的时间,因此,为了适应于高通量检测诊断病原体的生物芯片技术的飞速发展,建立一个适用于下游探针设计的序列信息数据库就显得格外重要了。
为了从各方面对病原体基因组进行分析研究,国内外许多学者从一级数据库出发,构建了各种病原体二级数据库。如Suhua Chang等建立了一个流感病毒基因组序列数据库IVDB。Adams等从NCBI出发,建立了一个广泛的植物和真菌病毒基因和基因组数据库DPAweb。Hirahata等在此基础上从DDBJ出发建立了一个包含所有病毒基因组序列信息的数据库GIB-V,并整合了几种常见的数据分析工具。为了衔接病毒基因组和蛋白质组信息,更全面的对病毒的科和属进行区分,Hulo等建立了一个广泛的病毒基因组和蛋白质组数据库ViralZone。而为了增强对抗原变异的理解,Hayes等建立了一个包含了27个科,42个种的病原物序列信息数据库varDB。综上所述,这些数据库都是针对某一种或几种病原物和特定的目标功能而建立的,都是在一级数据库基础上进行的序列信息提取、筛选和重组,能够在一定程度上解决一些生物学问题。但是这些数据库也存在着以下几点不足:1)数据库所包含的病原物种类单一,如IVDB、DPAweb、GIB-V、ViralZone只包含了病毒的信息;2)就varDB而言,包含了多种病原物的基因组序列和蛋白质序列的信息,但是这种序列信息也还是需要进一步大量而复杂的处理和筛选,才能进一步的进行下游生物芯片探针设计。
发明内容
近年来,随着DNA测序技术的高速发展,人类已知的DNA核酸序列不断增长,而伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的二级生物学数据库,如雨后春笋般迅速出现和成长,而这些生物学数据库往往是针对某种特定的功能而建立。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京健数通生物计算技术有限公司,未经北京健数通生物计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110348760.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用