[发明专利]基于血浆多组学多维特征和人工智能预测肿瘤风险值的方法有效
申请号: | 202011197469.0 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112397143B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李世勇;吴巍;钟果林;陈彦;茅矛;封裕敏 | 申请(专利权)人: | 深圳思勤医疗科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10;G16B40/00;G16H50/30;G16H50/70;C12Q1/6869 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 孙璐璐 |
地址: | 518000 广东省深圳市盐田区海山街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 血浆 多组学 多维 特征 人工智能 预测 肿瘤 风险 方法 | ||
本发明涉及生物信息领域,具体地,本发明涉及基于血浆多组学多维特征和人工智能预测待测样本来源的方法、系统、电子设备和计算机可读介质。本发明采用cfDNA低深度全基因组测序加血浆肿瘤标志物检测,并且利用机器学习的方法构建多变量预测待测样本来源模型,以区分待测样本来源于肿瘤样本还是正常样本。本发明提供的预测待测样本来源的方法/模型,利用五个维度:血浆中cfDNA浓度,基因拷贝数变异、片段化模式、肿瘤标志物、线粒体插入片段在150bp以下的比例,并对所有量化的数值指标进行标准化转化,最后对每个标准化指标的患癌贡献度进行加权,得到待测样本来源于肿瘤患者的概率,使检测成本更加可控的前提下,以更加灵敏和特异地预测待测样本来源。
技术领域
本发明涉及生物信息领域,具体地,本发明涉及基于血浆多组学多维特征和人工智能预测待测样本来源的方法、系统、电子设备和计算机可读介质。
背景技术
基因拷贝数变异(copy-number aberration,CNA)是许多人类疾病(如癌症、遗传性疾病、心血管疾病)的一种重要分子机制。通常指基因组中长度在1Kb以上的DNA片段发生了基因组结构变异,包括显微水平(microscopic)和亚显微水平(submicroscopic)的DNA缺失、插入、重复。大量研究表明,CNV(copy-number variation,CNV)在癌症发生发展过程中起到了关键性驱动作用,CNV通过DNA片段的缺失、插入、重复等扰乱基因组,尤其破环了控制细胞分裂的重要信号通路与基因的正常表达,使得细胞获得了更加有利于癌症生长的染色体组型,从而导致了癌症的发生。CNV已经被公认为是癌症基因组普遍存在的特征之一。在常见癌症中,约60%非小细胞肺癌,60-80%的乳腺癌,70%的结直肠癌,以及30%的前列腺癌都出现了不同程度偏离二倍体的核型。
多项研究表明,血液中来自于肿瘤细胞的循环肿瘤DNA (circulating tumorDNA,ctDNA)片段短于正常的cfDNA,通过两端测序可以评估cfDNA片段大小。同时cfDNA在基因组中的片段化模式在正常人和癌症患者中有着明显的差异,在不同组织来源的癌症中其模式也存在着差别。
最近,剑桥大学癌症研究中心的Rosenfeld教授团队和约翰斯霍普金斯大学医学院Velculescu教授团队也通过全基因组低深度测序来评估基因拷贝数变异,同时结合invitro/in silicocfDNA片段筛选的方法,来探索和验证基于cfDNA的全基因组低深度测序在癌症早期筛查和复发监测中的应用前景。无独有偶,约翰·霍普金斯大学Kimmel癌症中心的研究人员开发了一种简单的新型血液检测方法—DELFI,通过分析cfDNA片段模型,区分正常人与癌症患者。
利用基因拷贝数变异和cfDNA片段模型以确定样本来源,可用于筛选癌症治疗药物或探知个体患癌原因的研究,然而目前尚未开发出检测成本可控,更加灵敏、特异地确定待测样本来源的方法。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提供基于血浆游离DNA和蛋白质的多维特征和人工智能预测待测样本来源的方法,基于癌症基因组全景结合肿瘤标志物的技术路线。该技术以二代测序技术为基础,通过低深度全基因组测序(shallow WGS,sWGS)的方法绘制待测样品cfDNA中癌症基因组全景图谱的变化,同时联合特异性肿瘤标志物组合,结合大数据和人工智能,预测待测样本来源于肿瘤患者的概率。本发明基于待测样本的染色体不稳定指数、片段化模式、蛋白质标志物含量以及线粒体插入片段在150bp以下,通过多维度多变量加权算法,同时结合基因组学标记物和肿瘤蛋白标志物组合,以及血浆中cfDNA的浓度,使检测成本更加可控的前提下,更加灵敏和特异地预测待测样本来源。与基于靶向panel的技术相比,该检测方法覆盖基因组区域更广。
为此,本发明一方面提供一种预测待测样本来源的方法。根据本发明的实施例,所述方法包括:
(1)获取待测样本中染色体不稳定性指数;
(2)获取基于片段化模式确定待测样本来源于肿瘤患者的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思勤医疗科技有限公司,未经深圳思勤医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011197469.0/2.html,转载请声明来源钻瓜专利网。