[发明专利]基于原始基因组数据生成可配置文本串有效
申请号: | 201980007894.8 | 申请日: | 2019-01-09 |
公开(公告)号: | CN111566741B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | A·泽希尔;J·S·齐格勒 | 申请(专利权)人: | 纪念斯隆-凯特林癌症中心 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/20;C12Q1/68 |
代理公司: | 北京坤瑞律师事务所 11494 | 代理人: | 封新琴 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 原始 基因组 数据 生成 配置 文本 | ||
1.一种基于原始基因组数据生成可配置文本串的系统,其包括:
一个或多个处理器;和
包括指令的一个或多个存储器元件,所述指令在被执行时使所述一个或多个处理器:
接收包含连续文本串的计算机文件,所述连续文本串具有基于使用人类参考基因组构建的患者样本的拷贝数分析的多个文本片段,每个文本片段包括染色体编号、细胞遗传学条带(cytoband)信息、拷贝数参数和与所述拷贝数参数相关的核苷酸位置末端,所述核苷酸位置末端限定核苷酸范围;
对所述连续文本串中的每个文本片段确定染色体编号、细胞遗传学条带信息、拷贝数参数和与所述拷贝数参数相关的核苷酸位置末端,其中确定所述染色体编号、所述细胞遗传学条带信息、所述拷贝数参数和所述核苷酸位置末端包括对每个文本片段(i)通过识别所述染色体编号来定位文本片段开始位置,和(ii)通过识别所述拷贝数参数来定位文本片段结束位置;
对每个文本片段:
(1)将所述核苷酸范围内的一组基因与人类参考基因组列表中的对应基因区域进行比较以识别落入所述核苷酸范围内的一种或多种疾病相关基因;
(2)基于多个翻译规则,
(a)将所述染色体编号翻译为对应于所述染色体编号的第一文本,
(b)将所述拷贝数参数翻译为指示小克隆是否存在的第二文本,
(c)将所述拷贝数参数和所述核苷酸范围翻译成为第三文本,所述第三文本指示对应于所述核苷酸范围的所述基因区域的增益或损失,以及
(d)将落入所述核苷酸范围内的一种或多种疾病相关基因翻译为第四文本,所述第四文本指示拷贝数特征,并且
在输出界面上,对至少一条染色体呈现并入以下中的至少两种的可视化表示:
(i)第一文本区域,其用对应于所述染色体编号的所述第一文本填充,
(ii)第二文本区域,其用指示小克隆是否存在的第二文本填充,
(iii)第三文本区域,其用指示对应于所述核苷酸范围的所述基因区域的增益或损失的第三文本填充,以及
(iv)第四文本区域,其用指示拷贝数特征的第四文本填充。
2.根据权利要求1所述的系统,其中所述计算机文件是具有原始基因组数据的输出文件,所述原始基因组数据由下一代测序仪生成。
3.根据权利要求2所述的系统,其中所述下一代测序仪包括Illumina测序仪、IonTorrent测序仪、或454焦磷酸测序仪中的至少一种。
4.根据权利要求1所述的系统,其中每个文本片段对应于由所述染色体编号识别的染色体的短臂、长臂、或所述短臂和长臂的组合中的至少一者,并且其中所述一个或多个存储器元件包括指令,所述指令在被执行时使所述一个或多个处理器基于所述核苷酸范围对所述至少一条染色体在所述可视化表示中呈现第五文本区域,所述第五文本区域指示由所述染色体编号识别的染色体的短臂、长臂、或所述短臂和长臂的组合中的至少一者。
5.根据权利要求1所述的系统,其中所述一个或多个存储器元件包括指令,所述指令在被执行时使所述一个或多个处理器:
填充基于所述拷贝数参数的第三文本区域和所述多个翻译规则的基因损失-增益规则,当所述拷贝数参数包括小于2的数字时,所述基因损失-增益规则将所述第三文本指定为″损失″。
6.根据权利要求1所述的系统,其中所述人类参考基因组列表包括GRCh38、GRCh37、NCBI Build 36.1、NCBI Build 35、NCBI Build 34、hg38、hg19、hg18、hg17、和hg16中的至少一者。
7.根据权利要求1所述的系统,其中所述一种或多种疾病相关基因包括至少一种癌症相关基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纪念斯隆-凯特林癌症中心,未经纪念斯隆-凯特林癌症中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980007894.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置