[发明专利]基于血浆多组学多维特征和人工智能预测肿瘤风险值的方法有效
申请号: | 202011197469.0 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112397143B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李世勇;吴巍;钟果林;陈彦;茅矛;封裕敏 | 申请(专利权)人: | 深圳思勤医疗科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10;G16B40/00;G16H50/30;G16H50/70;C12Q1/6869 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 孙璐璐 |
地址: | 518000 广东省深圳市盐田区海山街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 血浆 多组学 多维 特征 人工智能 预测 肿瘤 风险 方法 | ||
1.一种预测待测样本来源的方法,其特征在于,包括:
(1)获取所述待测样本中染色体不稳定性指数;
(2)获取基于片段化模式确定所述待测样本来源于肿瘤患者的概率;
(3)获取基于待测样本肿瘤蛋白质标志物含量确定所述待测样本来源于肿瘤患者的概率;
(4)获取所述待测样本线粒体插入片段在150bp以下的比例;
(5)获取所述待测样本中cfDNA的浓度;
(6)对(1)~(5)中获得的数值进行标准化转化,对每个标准化转化指标的患癌贡献度进行加权,确定所述待测样本来源于肿瘤患者的概率,以便预测所述待测样本来源,
其中,基于片段化模式确定所述待测样本来源于肿瘤患者的概率是通过以下步骤实现的:
(2-1)从所述待测样本中获取cfDNA样本;
(2-2)基于所述cfDNA样本,构建测序文库;
(2-3)对所述测序文库进行测序,以便获得测序结果,所述测序结果由多个测序读段构成;
(2-4)基于所述测序读段,统计P100、P180、P250、峰谷间距和插入片段长度分布中峰值对应的片段长度;
(2-5)获取待测样本基因组,构建测序文库并进行测序,基于测序结果中的测序读段,以便获得不同染色体区域中不同预定长度插入片段的测序读段数目的比值,计算差异总和;
(2-6)对(2-4)和(2-5)获得的结果使用机器学习的方法进行建模,基于建模结果预测待测样本来源的分值,
其中,P100是指所述待测样本的插入片段30~100bp的数量除以总的插入片段总数的数量的比值;
P180是指所述待测样本的插入片段180~220bp的数量除以总的插入片段总数的数量的比值;
P250是指所述待测样本的插入片段250~300bp的数量除以总的插入片段总数的数量的比值;
所述峰谷间距是指插入片段在小于150bp范围内,每个波峰与与其相邻的波谷对应长度±2bp的插入片段的测序读段数目占样本染色体的测序读段的总数目的比例的差值;
所述插入片段长度分布中峰值对应的片段长度是基于统计样本不同插入片段长度对应的测序读段数目,测序读段数目最多对应的片段长度,
所述差异总和的计算方法为将每个插入片段读段数目加和的比值减去所有插入片段读段数目加和的比值的中位值后的绝对值求和,公式如下:
Σabs(Si/Li-median(S1/L1,S2/L2,…,Sn/Ln));
其中,S为100~150bp的插入片段,L为151~220bp的插入片段,abs()指对括号内的值求绝对值,median()指对括号内的值求中位值,i为每个插入片段的读段区间,n为插入片段的读段区间总数,
所述机器学习建立的模型选自SVM、Lasso、GBM中的至少之一。
2.根据权利要求1所述的方法,其特征在于,步骤(6)中获得所述待测样本来源于肿瘤患者的概率的算法的计算公式为:
式中,x1表示染色体不稳定性指数;
x2表示基于片段化模式确定所述待测样本来源于肿瘤患者的概率;
x3表示基于肿瘤蛋白质定量后确定所述待测样本来源于肿瘤患者的概率;
x4表示线粒体插入片段在150bp以下的比例;
x5表示血浆中cfDNA的浓度;
α是一个常数,β1、β2、β3、β4、β5是通过机器学习逻辑回归预测出来的回归系数。
3.根据权利要求1所述的方法,其特征在于,在步骤(2-5)中,不同染色体区域中不同预定长度插入片段的测序读段数目的比值通过以下方式获取:
a)将人的参考基因组划分为多个相同长度的窗口区间;
b)确定每个所述窗口区间内不同预定长度插入片段的测序读段数目;
c)确定每个所述窗口区间内不同预定长度插入片段的测序读段数目的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思勤医疗科技有限公司,未经深圳思勤医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011197469.0/1.html,转载请声明来源钻瓜专利网。