[发明专利]用以分析细菌菌种的测序数据的系统及其方法在审
申请号: | 201610083766.X | 申请日: | 2016-02-06 |
公开(公告)号: | CN106778071A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 郑佳扬;徐仁徽;刘韦驿;蔡孟勳;卢子彬;赖亮全;庄曜宇 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 徐金国 |
地址: | 中国台湾台北市*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用以 分析 细菌 菌种 序数 系统 及其 方法 | ||
1.一种用以分析细菌菌种的测序数据的系统,其特征在于包含:
单一检体去重复序列模块,用以搜索第一基因样本序列中的第一保守区域及一特定变异区域,并将该第一保守区域移除;
跨检体重复序列判断模块,用以判断该特定变异区域是否存在与第二基因序列中的另一特定变异区域相同的一跨检体子序列;
重复序列记录模块,当该特定变异区域存在与该第二菌体样本中的该另一特定变异区域相同的该跨检体子序列时,该重复序列记录模块用以储存该跨检体子序列至一记录表中;
运算贴序模块,当存在该跨检体子序列时,该运算贴序模块用以将该跨检体子序列与数据库模块中的多个已知菌种基因序列进行比对,以分析该第一基因样本序列与该第二基因样本序列中对应该跨检体子序列的菌种。
2.根据权利要求1所述的用以分析细菌菌种的测序数据的系统,还包含:
检体采样模块,用以采样多个菌体样本,该些菌体样本包含第一菌体样本及第二菌体样本;以及
基因测序模块,用以将该些菌体样本分别进行基因测序,以取得对应该第一菌体样本的第一基因样本序列,及对应该第二菌体样本的第二基因样本序列。
3.根据权利要求2所述的用以分析细菌菌种的测序数据的系 统,其中,该重复序列记录模块更用以记录该跨检体子序列所对应的该另一特定变异区域、该跨检体子序列所对应的该另一特定变异区域的所属的该第二菌体样本。
4.根据权利要求1所述的用以分析细菌菌种的测序数据的系统,其中,该第一基因样本序列包含第一基因片段及第二基因片段,
其中,当该第一基因片段与该第二基因片段完全相同时,该单一检体去重复序列模块将该第二基因片段视为至少第一保守区域的其中之一,该特定变异区域排除该第二基因片段;以及
该运算贴序模块将该第一基因片段与该数据库模块中的该些已知菌种基因序列进行比对,以分析对应该第一基因片段的菌种。
5.根据权利要求1所述的用以分析细菌菌种的测序数据的系统,其中,该第一基因样本序列包含第一基因片段及第二基因片段,当该第一基因片段长于该第二基因片段,且该第二基因片段完全相同于该第一基因片段的一部分时,该运算贴序模块将该第一基因片段与该数据库模块中的该些已知菌种基因序列进行比对,以分析对应该第一基因片段的菌种。
6.根据权利要求5所述的用以分析细菌菌种的测序数据的系统,其中该第一基因样本序列包含第一基因片段及第二基因片段,当该第一基因片段长于该第二基因片段,且该第二基因片段完全相同于该第一基因片段的一部分时,该运算贴序模块将该第二基因片段储存至该记录表中。
7.一种用以分析细菌菌种的测序方法,其特征在于包含:
搜索第一基因样本序列中的特定变异区域以及搜索第二基因样本序列中的另一特定变异区域;
判断该特定变异区域与该另一特定变异区域是否存在相同的一跨检体子序列;
当该特定变异区域与该另一特定变异区域存在相同的该跨检体子序列时,储存该跨检体子序列至记录表中;以及
当存在该跨检体子序列时,将该跨检体子序列与数据库模块中的多个已知菌种基因序列进行比对,以分析该第一基因样本序列与该第二基因样本序列中对应该跨检体子序列的菌种。
8.根据权利要求7所述的用以分析细菌菌种的测序方法,其中该第一基因样本序列包含第一基因片段及第二基因片段,其中搜索该第一基因样本序列中的该特定变异区域的步骤包含:
判断该第一基因片段与该第二基因片段是否完全相同;以及
当该第一基因片段与该第二基因片段完全相同时,该特定变异区域排除该第二基因片段。
9.根据权利要求7所述的用以分析细菌菌种的测序方法,其中,该第一基因样本序列包含第一基因片段及第二基因片段,当该第一基因片段长于该第二基因片段时,其中搜索该第一基因样本序列中的该特定变异区域的步骤包含:
判断该第二基因片段是否完全相同于该第一基因片段的一部分;以及
当该第二基因片段完全相同于该第一基因片段的一部分,该特定
变异区域排除该第二基因片段。
10.根据权利要求9所述的用以分析细菌菌种的测序方法,包
含:
当该第一基因片段长于该第二基因片段,且该第二基因片段完全相同于该第一基因片段的一部分时,将该第二基因片段储存至该记录表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610083766.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人类蛋白质亚细胞位置预测方法
- 下一篇:一种评估肿瘤负荷变化的方法和系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用