[发明专利]一种HIV亚型分类系统及分类方法在审
申请号: | 202110698660.1 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113409886A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 于斌;姜淼 | 申请(专利权)人: | 北京良芯生物科技发展有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16H50/80 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 李潇 |
地址: | 102600 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hiv 分类 系统 方法 | ||
本发明涉及生物信息领域,尤其涉及一种HIV亚型分类系统及分类方法。本发明构建的HIV亚型分类系统包括数据库池、分型模块和数据管理模块,数据库池囊括了已知的所有基因型和基因亚型的HIV序列。数据库管理模块可以定期自动化完成公共数据库数据的下载工作,自动化完成比对数据库构建、扩容与数据库池整合工作。通过引入数据库池和三个分型模块,大大提高对HIV分型工作的准确度和效率。用户只需要输入HIV测序结果,数据库系统就可以自动完成数据标准化、序列分型工作,用户可以继续根据需要将新获得的标准化序列收录至数据库池。
技术领域
本发明涉及生物信息领域,尤其涉及一种HIV亚型分类系统及分类方法。
背景技术
HIV包括A、B、C、D、F、G、H、J、K等亚型,而且重组型的整体比例随时间也持续增加。HIV多样性是复杂的和不断演变的,是HIV疫苗开发的一大挑战。监测HIV型的全球分子流行病学对艾滋病毒疫苗的设计、检测和实施仍然至关重要。
HIV分型对感染者耐药检测结果的解释和个体化治疗方案的制定具有指导意义。由于亚型特异性遗传屏障能够在耐药突变的发生和发展中起作用,或者由于其他耐药位点对主要耐药位点产生的影响不同对不同亚型的进化方向和进化速度上产生了影响。不同亚型之间的耐药突变位点及其频率不同,新的耐药突变位点不断被报道,同时一些无法解释的药物敏感性也影响到了对基因型耐药检测结果的解释,因此评估耐药突变的亚型特异性,在耐药突变特征上的差别在为病人设计ART治疗方案时具有重要的参考价值。
虽然现有HIV生物信息数据库已经方便了研究人员和医疗人员开展相关工作,但是在具体使用这些数据库的过程中仍然存在一些困难和风险,具体如下:
1.现有的公共数据库信息来源分散,并且这些数据库的HIV序列信息绝大多数基于一代测序结果,序列质量也无法保证。
2.基于HIV二代测序结果的公共数据库基因型变异注释功能仍处于Beta测试阶段,如HIVDB的HGS-Beta。与此同时,只有少量数据库的二代测序注释工具拥有整合自有数据库的功能,另外,这些注释工具整合自有数据的灵活度和效率都不高。
3.现有的公共数据库注释工具大多采取单线程模式执行任务,难以胜任以计算机集群计算和大数据为基础的主流数据分析任务。
发明内容
考虑到以上问题,本发明的目的是提供一种HIV亚型分类系统。
本发明的再一目的是提供一种HIV亚型分类方法。
根据本发明的HIV亚型分类系统包括:
数据库池,所述数据库池包括来自开放公共数据库的HIV一代测序序列和HIV二代测序数据;
数据库管理模块,所述数据库管理模块包括数据库池构建与整合模块和数据更新模块,其中,
所述数据库池构建与整合模块将输入的二代测序BAM文件处理成一致性序列Reads.fasta;并且将经质量核查的HIV序列收录至所述数据库池;以及将开放公共数据库新增的序列收录至所述数据库池,
所述数据更新模块用于定期自动下载公共数据库序列;
分型模块,所述分型模块包括以下分型子模块:
HIV二代测序数据分型子模块,所述HIV二代测序数据分型子模块用于统计数据库池中的一致性序列对所有HIV亚型的断点覆盖情况,计算并对比不同HIV亚型对应的断点覆盖率,对比待分类样本的断点覆盖率,输出待检测样本的分型结果,
HIV一代测序数据分型子模块,用于将待分型样本的一致性序列直接blast比对数据库池中的HIV一代测序序列,输出序列相似度比对结果,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京良芯生物科技发展有限公司,未经北京良芯生物科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110698660.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车票报销录入装置
- 下一篇:一种污染土筛分及打包设备装置