[发明专利]基因组测序选择系统在审
申请号: | 201980068946.2 | 申请日: | 2019-10-16 |
公开(公告)号: | CN113166806A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | A·巴塔查里亚;A·杰拉西莫娃;Q·阮;C·埃尔津加;E·莫勒 | 申请(专利权)人: | 奎斯特诊断投资有限责任公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;C40B40/06;G16B40/00;G16B30/00 |
代理公司: | 北京坤瑞律师事务所 11494 | 代理人: | 封新琴 |
地址: | 美国新*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 选择 系统 | ||
1.一种用于过滤测序数据的方法,其包括:
由数据处理系统接收包括多个基因序列的数据,其中所述多个基因序列中的每一个基因序列包括染色体的指示、位置的指示、碱基值和质量得分;
由所述数据处理系统选择所述多个基因序列的子集,其中所述多个基因序列的所述子集中的每一个基因序列具有相同的染色体的指示;
由所述数据处理系统从所述多个基因序列的所述子集中过滤包括具有高于预定阈值的相关联质量得分的碱基值的基因序列;
由所述数据处理系统确定经过滤的基因序列的每个位置的聚合计数;
由所述数据处理系统确定经过滤的基因序列的每个位置的替代碱基计数;
由所述数据处理系统响应于每个位置的替代碱基计数与每个位置的聚合计数的比率超过阈值来生成基因序列变异的标识符。
2.根据权利要求1所述的方法,其进一步包括确定经过滤的基因序列中的缺失序列的替代计数。
3.根据权利要求2所述的方法,其中所述缺失序列开始于邻近所述位置的索引处。
4.根据权利要求1所述的方法,其进一步包括确定经过滤的基因序列中的插入序列的替代计数。
5.根据权利要求4所述的方法,其中确定所述插入序列的替代计数进一步包括识别替代序列匹配。
6.根据权利要求1所述的方法,其进一步包括识别所述多个基因序列中的结构变异。
7.根据权利要求6所述的方法,其进一步包括基于所述多个基因序列中识别的所述结构变异来确定所述替代碱基计数。
8.根据权利要求6所述的方法,其中确定所述聚合计数进一步包括对经过滤的基因序列中的每一个基因序列与CIGAR字符串的匹配进行计数。
9.根据权利要求6所述的方法,其中确定所述聚合计数进一步包括对所述多个基因序列的所述子集中的每一个基因序列中的缺失、插入、参照跳跃、软剪切或硬剪切进行计数。
10.根据权利要求1所述的方法,其进一步包括基于所述聚合计数和所述替代碱基计数来计算所述多个基因序列的均值读取覆盖、最大值读取覆盖或最大读取覆盖中的至少一项。
11.根据权利要求1所述的方法,其进一步包括基于所述聚合计数和所述替代碱基计数来计算所述多个基因序列的链偏向性。
12.一种用于过滤测序数据的系统,其包括:
与存储器设备通信的处理器,所述处理器执行数据解析器和过滤引擎;其中所述数据解析器被配置成:
由从所述存储器设备接收包括多个基因序列的数据,其中所述多个基因序列中的每一个基因序列包括染色体的指示、位置的指示、碱基值和质量得分,并且
选择所述多个基因序列的子集,其中所述多个基因序列的所述子集中的每一个基因序列具有相同的染色体的指示;并且
其中所述过滤引擎被配置成:
从所述多个基因序列的所述子集中过滤包括具有高于预定阈值的相关联质量得分的碱基值的基因序列,
确定经过滤的基因序列的每个位置的聚合计数,
确定经过滤的基因序列的每个位置的替代碱基计数,并且
响应于每个位置的替代碱基计数与每个位置的聚合计数的比率超过阈值来生成基因序列变异的标识符。
13.根据权利要求12所述的系统,其中所述过滤引擎进一步被配置成确定经过滤的基因序列中的缺失序列的替代计数。
14.根据权利要求12所述的系统,其中所述过滤引擎进一步被配置成确定经过滤的基因序列中的插入序列的替代计数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奎斯特诊断投资有限责任公司,未经奎斯特诊断投资有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980068946.2/1.html,转载请声明来源钻瓜专利网。