[发明专利]用于癌症筛查的系统及其方法在审
申请号: | 202210182941.6 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114974430A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 田继超;杨亚东;李永君;王小奇;彭勇飞;连明 | 申请(专利权)人: | 博尔诚(北京)科技有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B30/10;G16B20/20;G16B20/10 |
代理公司: | 北京彩和律师事务所 11688 | 代理人: | 闫桑田;刘磊 |
地址: | 100176 北京市大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 癌症 系统 及其 方法 | ||
1.一种用于癌症筛查的系统,其包括:
数据采集模块,其用于获取受试者目标区域的甲基化水平、肿瘤分数、肿瘤倍性、cfDNA片段长度特征值和reads分布的数据;以及
癌症计算模块,其基于数据采集模块中获取的甲基化水平、肿瘤分数、肿瘤倍性、cfDNA片段长度特征值和reads分布的数据以预测受试者罹患癌症的概率。
2.根据权利要求1所述的系统,其中,
所述数据采集模块包括测序模块、甲基化水平分析模块、肿瘤分数分析模块、肿瘤倍性分析模块、cfDNA片段长度特征值分析模块和reads分布分析模块;
所述测序模块用于对受试者的cfDNA进行全基因组测序;
所述甲基化水平分析模块基于从测序模块获得测序数据来分析目标区域的甲基化水平;
所述肿瘤分数分析模块基于从测序模块获得测序数据来分析肿瘤分数;
所述肿瘤倍性分析模块基于从测序模块获得测序数据来分析肿瘤倍性;
所述cfDNA片段长度特征值分析模块基于从测序模块获得的测序数据中提取cfDNA片段的长度来计算与长度相关的罹患肿瘤的风险特征值;
所述reads分布分析模块基于从测序模块获得的测序数据中分析reads分布进而预测各reads的来源。
3.根据权利要求1或2所述的系统,其中,
所述目标区域包括以下区域中的任意一种或两种以上:
2号染色体223721500-223726500位,
6号染色体170147000-170152000位,
8号染色体182500-187500位,
8号染色体64081500-64086500位,
9号染色体14688500-14693500位,
10号染色体119803500-119808500位,或
15号染色体56285500-56290500位。
4.根据权利要求1~3中任一项所述的系统,其中,
目标区域的甲基化水平是基于目标区域每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值;
肿瘤分数是指ctDNA在cfDNA中所占的比例,即肿瘤细胞释放的游离DNA占总cfDNA中的比例;
肿瘤倍性是指染色体结构和数目异常导致的肿瘤样本中癌细胞的真正含量,即肿瘤的倍体个数;
所述cfDNA片段长度特征值分析模块基于从测序模块获得的测序数据中提取cfDNA片段的长度来计算与长度相关的罹患肿瘤的风险特征值是基于cfDNA片段长度中的短片段与长片段之间的比率,通过梯度提升树模型来计算得到cfDNA片段长度特征值;
优选地,长片段是长度为201~320bp的片段;
短片段是长度为150~200bp的片段;
reads分布是指通过对cfDNA测序数据中的每条reads进行统计而得到的样本来源的概率,即给定reads来源于健康血浆、正常组织和肿瘤组织三个来源组分的概率。
5.根据权利要求1~4中任一项所述的系统,其中,
cfDNA测序数据是经过去除低质量测序片段后的cfDNA测序数据;
优选地,cfDNA测序数据是去除低质量测序片段后进一步排除了低比对率区间内的测序数据后的测序数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博尔诚(北京)科技有限公司,未经博尔诚(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210182941.6/1.html,转载请声明来源钻瓜专利网。