[发明专利]压缩分子标记的核酸序列数据的方法有效
申请号: | 201880032274.5 | 申请日: | 2018-05-15 |
公开(公告)号: | CN110914911B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | C-Z·白 | 申请(专利权)人: | 生命科技股份有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G16B50/00;G16B50/50;C12Q1/6869;G16B30/10 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈洁;周全 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩 分子 标记 核酸 序列 数据 方法 | ||
一种压缩分子标记的序列数据的方法,包括:将与分子标记序列相关的序列读段分组以形成序列读段家族、流动空间信号测量值的对应向量和对应的序列比对值,计算所述流动空间信号测量值的对应向量的算术平均值以形成共有流动空间信号测量值的向量,计算所述流动空间信号测量值的对应向量的标准偏差以形成标准偏差向量,基于所述共有流动空间信号测量值的向量确定共有碱基序列,确定共有序列比对值并生成包含共有压缩数据的压缩数据结构,所述共有压缩数据包括每个家族的所述共有碱基序列、所述共有序列比对值、所述共有流动空间信号测量值的向量、所述标准偏差向量和成员数量。
交叉引用
本申请根据35U.S.C.§119(e)要求2017年5月16日提交的美国临时申请第62/507,117号和2017年6月9日提交的美国临时申请第62/517,235号的权益。前述申请的整个内容通过引用并入本文。
发明内容
核酸序列的分子标记可用于鉴定源自相同多核苷酸分子的核酸序列读段,并基于其标记序列将其分类为一个家族。可以存储使用各种技术、平台或工艺从核酸样品中获得的大量分子标记的核酸序列数据,并对其进行处理以进行变体识别。需要新的方法、系统和计算机可读介质来压缩核酸序列数据以减少对存储器的存储需求并提高变体识别操作的计算效率,而不损害变体识别的质量。
根据一个示例性实施方案,提供了一种用于压缩分子标记的核酸序列数据的方法,其包括(a)接收多个核酸序列读段、多个流动空间信号测量值的向量和多个序列比对值,其中每个序列读段与分子标记序列相关,所述分子标记序列标识由核酸样品中的特定多核苷酸分子产生的序列读段家族,其中每个流动空间信号测量值的向量和每个序列比对值与其中一个序列读段相对应;(b)将与相同分子标记序列相关的序列读段分组以形成序列读段家族、流动空间信号测量值的对应向量和对应的序列比对值,每个家族具有许多成员;(c)计算流动空间信号测量值的对应向量的算术平均值以形成所述家族的共有流动空间信号测量值的向量;(d)计算所述流动空间信号测量值的对应向量的标准偏差以形成所述家族的标准偏差向量;(e)基于所述家族的所述共有流动空间信号测量值的向量确定共有碱基序列;(f)通过将所述共有碱基序列与所述家族的所述对应序列比对值的映射质量最高的所述序列读段进行比较来确定共有序列比对值;和(g)生成包含共有压缩数据的压缩数据结构,所述共有压缩数据包括每个家族的所述共有碱基序列、所述共有序列比对值、所述共有流动空间信号测量值的向量、所述标准偏差向量和成员数量。
根据一个示例性实施方案,提供了一种非临时性机器可读存储介质,其包括在由处理器执行时,使所述处理器进行用于压缩分子标记的核酸序列数据的方法的指令,所述方法包括(a)接收多个核酸序列读段、多个流动空间信号测量值的向量和多个序列比对值,其中每个序列读段与分子标记序列相关,所述分子标记序列标识由核酸样品中的特定多核苷酸分子产生的序列读段家族,其中每个流动空间信号测量值的向量和每个序列比对值与其中一个序列读段相对应;(b)将与相同分子标记序列相关的序列读段分组以形成序列读段家族、流动空间信号测量值的对应向量和对应的序列比对值,每个家族具有许多成员;(c)计算流动空间信号测量值的对应向量的算术平均值以形成所述家族的共有流动空间信号测量值的向量;(d)计算所述流动空间信号测量值的对应向量的标准偏差以形成所述家族的标准偏差向量;(e)基于所述家族的所述共有流动空间信号测量值的向量确定共有碱基序列;(f)通过将所述共有碱基序列与所述家族的所述对应序列比对值的映射质量最高的所述序列读段进行比较来确定共有序列比对值;和(g)生成包含共有压缩数据的压缩数据结构,所述共有压缩数据包括每个家族的所述共有碱基序列、所述共有序列比对值、所述共有流动空间信号测量值的向量、所述标准偏差向量和成员数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生命科技股份有限公司,未经生命科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880032274.5/2.html,转载请声明来源钻瓜专利网。