[发明专利]单一生物单元的序列信息的新型处理方法在审
申请号: | 202080046760.X | 申请日: | 2020-04-24 |
公开(公告)号: | CN114245922A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 有川浩司;细川正人;竹山春子;小川雅人;井手圭吾 | 申请(专利权)人: | 比特拜欧姆株式会社 |
主分类号: | G16B30/20 | 分类号: | G16B30/20 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李雪;姚开丽 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单一 生物 单元 序列 信息 新型 处理 方法 | ||
本发明提供微生物基因组数据的自动构建和提供系统。一种处理单一生物单元的序列信息的方法,该方法包括如下步骤:(A)对多个单一(single)生物单元(例如,细胞)的基因组(或同等的基因集合)的部分序列信息(在玻片(slide)中的SAG),基于生物谱系鉴定用序列(162SrRNA或标记基因),按照每个同一谱系进行聚类化;以及(B)根据需要而与数据库中的该单一生物单元的基因组的信息进行核对。
技术领域
本发明提供单一生物单元的序列信息的新型处理方法、系统以及相关技术。更具体而言,提供微生物基因组数据的自动构建和提供系统。
背景技术
虽然微生物基因组数据的构建正在取得进展,但目前的数据大多基于宏基因组信息,当将复杂的菌群(bacterial flora)作为分析对象时,信息的质和量均不足。
尽管已经部分地取得了每个单一生物单元的遗传信息(基因组信息等),但并未提供对其的高品质的信息处理。
发明内容
用于解决课题的手段
本发明人进行了锐意研究,结果完成了下述系统:累积单一生物单元水平上的单一生物单元的序列信息,并从其中自动构建和提供高精度的微生物基因组数据。
作为本发明的实施方式的示例,列举如下。
项目1
一种方法,其是处理单一(single)生物单元的序列信息的方法,其中,该方法包括如下步骤:
(A)对多个单一生物单元的序列信息的部分序列信息,基于生物谱系鉴定用序列,按照每个同一谱系进行聚类化;
(B)根据需要,将数据库中的对应于所述聚类的该单一生物单元的部分序列信息追加至所述聚类中;以及
(C)使用该单一生物单元的序列信息的部分序列信息和该数据库中的该单一生物单元的序列信息,创建该单一生物单元的序列信息草图。
项目2
根据项目1所述的方法,其中,所述方法还包括:当进行所述(B)时,利用数据库。
项目3
一种方法,其是处理单一(single)生物单元的序列信息的方法,其中,该方法包括如下步骤:
A)从数据库提取草图中无重复的基因;
B)计算对应于每个该基因的草图的个数或比例;以及
C)选择该对应草图的个数或比例为规定值以上的基因作为生物谱系鉴定用序列候选。
项目3A
一种方法,其是处理单一(single)生物单元的序列信息的方法,其中,该方法包括如下步骤:
(A)对多个单一生物单元的序列信息的部分序列信息,基于生物谱系鉴定用序列,按照每个同一谱系进行聚类化;以及
(B)将数据库中的对应于所述聚类的部分序列信息与所述聚类的部分序列信息进行比较,计算每个部分序列的相似度,将规定相似度以上的部分序列鉴定为生物谱系鉴定用序列。
项目4
一种方法,其是处理单一生物单元的序列信息的方法,其中,该方法包括如下步骤:
(D)基于规定的判断基准,将多个单一生物单元的序列信息的部分序列信息按照品质从高至低进行排序;
(E)基于该排序,从高至低地选择该多个单一生物单元的序列信息的部分序列信息中的规定数量的集合,从该部分序列信息构建长度大于该部分序列信息的草图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于比特拜欧姆株式会社,未经比特拜欧姆株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080046760.X/2.html,转载请声明来源钻瓜专利网。