[发明专利]异常的片段检测及分类在审
申请号: | 201980023723.4 | 申请日: | 2019-03-13 |
公开(公告)号: | CN111989407A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 萨缪尔·S·格罗斯;康斯坦丁·达维多夫 | 申请(专利权)人: | 格里尔公司 |
主分类号: | C12Q1/6827 | 分类号: | C12Q1/6827;C12Q1/6886;G16B20/00 |
代理公司: | 上海翼胜专利商标事务所(普通合伙) 31218 | 代理人: | 翟羽 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 片段 检测 分类 | ||
1.一种检测在一细胞游离脱氧核糖核酸(cfDNA)样品片段中一异常的甲基化模式的方法,其特征在于:所述方法包括步骤:
存取一数据结构,所述数据结构包括:在一参考基因组内的多个CpG位点的字符串的计数,以及来自一训练片段集的所述多个CpG位点个别的甲基化状态;
产生用于一样品片段的一样品状态载体,所述样品状态载体包括:在所述参考基因组内的一样品基因组位置及在所述样品片段中的各个CpG位点的一甲基化状态,各个甲基化状态被确定为经甲基化或未经甲基化;
自所述样品基因组位置列举与所述样品状态载体的长度相同的多个甲基化状态的多个可能性;
针对各种可能性,通过存取存储在所述数据结构中的多个计数以计算一概率;
确定与所述样品状态载体相匹配的所述可能性,并相应地将所述经计算的概率作为一样品概率;
基于所述样品概率,相对于所述训练片段集,针对所述样品状态载体的所述样品片段产生一分数;以及
基于所述产生的分数,确定所述样品片段是否具有一异常的甲基化模式。
2.如权利要求1所述的方法,其特征在于:所述各个CpG位点的字符串包括:在所述参考基因组内的多个基因组位置处的各个所述CpG位点的所述甲基化状态,其中各个所述甲基化状态被确定为经甲基化或未经甲基化。
3.如权利要求1所述的方法,其特征在于:所述方法进一步包括:自所述训练片段集构建所述数据结构,且包括:
针对在所述训练片段集中的各个训练片段,产生一训练状态载体,所述训练状态载体包括:在所述参考基因组内的一已知的基因组位置及在所述训练片段中的各个CpG位点的所述甲基化状态,各个甲基化状态被确定为经甲基化或未经甲基化;
确定多个字符串,其中各个字符串是所述训练状态载体的一部分,
自所述多个训练状态载体确定各个字符串的一计数;以及
在所述数据结构中为各个字符串存储多个计数。
4.如权利要求1所述的方法,其特征在于:在基于所述产生的分数确定所述样品片段是否具有一异常的甲基化模式的步骤进一步包括:确定针对所述样品片段所产生的分数是否低于一阈值分数,其中所述阈值分数表明所述样品片段具有一异常的甲基化模式的一信任程度。
5.如权利要求4所述的方法,其特征在于:所述阈值分数是0.1或更小。
6.如权利要求1所述的方法,其特征在于:所述训练片段集包括:来自一个或多个健康受试者的训练片段,其中所述一个或多个健康受试者缺乏一特定的医学疾病,且其中相对于来自所述一个或多个健康受试者的所述训练片段集,所述样品片段被确定为一异常的甲基化。
7.如权利要求1所述的方法,其特征在于:针对所述样品片段产生所述分数包括:
针对多个甲基化状态的可能性,识别小于所述样品概率的的经计算的概率;以及
通过将所有所述经识别的概率与所述样品概率相加,以产生所述样品片段的所述分数。
8.如权利要求1的方法,其特征在于:在针对各种所述可能性,通过存取存储在所述数据结构中的多个计数以计算一概率的步骤包括:
针对多个条件元素中的各个条件元素,其中各个条件元素是一条件概率,所述条件概率考量在所述可能性中CpG位点的一子集,通过以下步骤计算一次序的一马尔可夫链概率,所述次序的所述马尔可夫链概率具有存储在所述数据结构中的多个计数,所述步骤包括:
识别与所述条件元素相匹配的字符串的数量的一第一计数;
在整数长度上,识别与所述条件元素的先前甲基化状态相匹配的字符串的数量的一第二计数;以及
通过将所述第一计数除以所述第二个计数,以计算所述马尔可夫链概率。
9.如权利要求8所述的方法,其特征在于:所述次序是选自由1、2、3、4、5、6、7、8、9、10、11、12、13、14及15所组成的群组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格里尔公司,未经格里尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980023723.4/1.html,转载请声明来源钻瓜专利网。