[发明专利]一种细菌菌株的分析方法、分析装置和存储介质在审
申请号: | 202011146154.3 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112233726A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 胡函;谭验 | 申请(专利权)人: | 深圳未知君生物科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 夏东栋 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细菌 菌株 分析 方法 装置 存储 介质 | ||
1.一种细菌菌株的分析方法,其特征在于,所述分析方法包括:
获取目标菌种的泛基因组数据,所述泛基因组数据包括目标菌种的多类菌株的参考基因序列;
获取多个样品的测序数据,每个样品包括多个菌种;
经由至少一个处理器,将每个样品的测序数据与所述目标菌种的泛基因组数据进行比对,以得到相对于泛基因组中各个参考基因的比对计数,并将相似基因的比对计数合并为基因家族的比对计数,以确定第一矩阵,所述第一矩阵的各个元素表征各个基因家族在各个样品中的比对计数相关信息;
经由所述至少一个处理器,将所述第一矩阵分解为第二矩阵和第三矩阵,所述第二矩阵的各个元素表征各个基因家族在各类菌株中的存在相关信息,所述第三矩阵的各个元素表征各类菌株在各个样品中的相对丰度相关信息。
2.根据权利要求1所述的分析方法,其特征在于,所述第一矩阵的行对应各个基因家族而列对应各个样品,所述第二矩阵的行对应各个基因家族而列对应各类菌株,所述第三矩阵的行对应各类菌株而列对应各个样品,所述存在相关信息为表示是否存在的二元信息,
将所述第一矩阵分解为第二矩阵和第三矩阵进一步包括:
进行初始化处理,以生成初始第二矩阵;
根据第一矩阵和初始第二矩阵的信息,生成初始第三矩阵;
基于所述初始第三矩阵,迭代地求解第二矩阵和第三矩阵,
其中,求解第三矩阵包括基于所述第一矩阵和当前得到的第二矩阵通过回归方法来求解所述第三矩阵,
求解第二矩阵进一步包括:
通过将所述第一矩阵与当前得到的第三矩阵的逆矩阵相乘,来确定第四矩阵;
确定所述第四矩阵每列与各个基因家族相关联的概率密度函数;
从所述第四矩阵的各列中去除与对应概率密度函数的低位分布峰对应的元素,以滤除噪声;
将滤除噪声后的第四矩阵中的各个元素与第一阈值进行比较,以得到所述第二矩阵。
3.根据权利要求2所述的分析方法,其特征在于,进行初始化处理进一步包括:
基于目标菌种的代表性菌株的基因相关信息来生成初始第二矩阵;
基于所述第一矩阵和所述初始第二矩阵,经由回归来求解得到所述初始第三矩阵。
4.根据权利要求3所述的分析方法,其特征在于,基于所述第一矩阵和所述初始第二矩阵,经由回归来求解得到所述初始第三矩阵进一步包括:
基于所述第一矩阵和所述初始第二矩阵,经由回归来求解得到第五矩阵,所述第五矩阵的各个元素表征各类菌株在各个样品中的相对丰度相关信息;
通过将所述第五矩阵的各个元素的代表值与第二阈值进行比较,来选出对应元素的代表值超出所述第二阈值的菌株类;
通过保留所述初始第二矩阵中选出的菌株类对应的列,来得到处理后的初始第二矩阵;以及
基于所述第一矩阵和处理后的初始第二矩阵,经过回归来求解得到所述初始第三矩阵。
5.根据权利要求2-4中的任何一项所述的分析方法,其特征在于,所述回归包括向非负值的线性回归。
6.根据权利要求1-4中的任何一项所述的分析方法,其特征在于,将多个样品的测序数据与所述目标菌种的泛基因组数据进行比对,以确定第一矩阵进一步包括:
通过所述比对,确定每个样品相对于所述目标菌种的泛基因组数据中各个基因的比对计数,以得到第六矩阵,所述第六矩阵的各个元素表示各个基因在各个样品中的比对计数;
基于基因长度和样品测序深度,对所述第六矩阵的各个元素进行标准化处理;
对标准化处理后的第六矩阵中归属于同个基因家族的各个基因的元素求和,来得到所述第一矩阵。
7.一种细菌菌株的分析装置,其特征在于,所述分析装置包括:
接口,其配置为:接收多个样品的测序数据,每个样品包括多个菌种;以及
至少一个处理器,其配置为执行根据权利要求1-6中的任何一项所述的细菌菌株的分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳未知君生物科技有限公司,未经深圳未知君生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011146154.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电脑机箱冲压废料回收装置及操作方法
- 下一篇:一种防倾倒组合式PE挤吹瓶