[发明专利]利用无细胞DNA样本中的小变异的多层分析的癌症组织来源预测在审
申请号: | 201980084821.9 | 申请日: | 2019-12-18 |
公开(公告)号: | CN113196404A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | E·哈贝尔;刘勤文 | 申请(专利权)人: | 格瑞尔公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B40/20 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 董莘 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 细胞 dna 样本 中的 变异 多层 分析 癌症 组织 来源 预测 | ||
1.一种用于确定针对受试者的癌症来源组织的方法,所述方法包括:
在处理来自所述受试者的无细胞脱氧核糖核酸(cfDNA)样本时,访问数据集,所述数据集包括从对所述cfDNA样本应用物理测定所生成的序列读数;
对所述数据集执行计算测定以生成一组特征的值;
用预测模型处理所述一组特征,以从候选组织来源集合生成针对所述受试者的癌症来源组织的预测,所述预测模型通过函数将所述一组特征的所述值转换为所述预测;以及
返回针对所述受试者的所述癌症来源组织的所述预测。
2.根据权利要求1所述的方法,还包括生成针对所述预测的置信度参数的值,并且在确定所述值满足阈值条件时,将所述预测提供给实体。
3.根据权利要求1所述的方法,其中用所述预测模型处理所述一组特征包括:
在应用所述预测模型的第一子模型时,将所述受试者分类到癌变组和非癌变组中的一个组,以及
在确定所述受试者被分类到所述癌变组时,应用所述预测模型的第二子模型来生成针对所述受试者的所述癌症来源组织的所述预测。
4.根据权利要求3所述的方法,还包括:基于所述第一子模型的输出,对来自所述受试者的预留样本执行反射测定,并且基于所述反射测定,将所述受试者分类到所述癌变组和所述非癌变组中的一个组。
5.根据权利要求3所述的方法,其中所述第一子模型是二元分类模型,所述二元分类模型允许与癌症分类的增加的可能性相对应的非负系数输出。
6.根据权利要求3所述的方法,其中所述第一子模型是二元分类模型,所述二元分类模型允许与癌症分类的降低的可能性相对应的负系数输出。
7.根据权利要求5所述的方法,其中所述二元分类模型包括阿尔法参数,所述阿尔法参数被配置为在岭回归模式和LASSO回归模式之间调节所述第一子模型的性能,所述方法还包括评估一组小变异特征中的每一个小变异特征对所述预测的贡献,并基于所述贡献来调整所述阿尔法参数。
8.根据权利要求5所述的方法,其中所述二元分类模型包括表征癌症信号强度的特异性条件,并且其中确定所述受试者被分类到所述癌变组包括将与所述cfDNA样本相关联的特异性值与所述特异性条件进行比较。
9.根据权利要求3所述的方法,其中所述第一子模型的输出系数集合包括与所述一组特征中的第一特征相对应的系数输出,所述第一特征表征在所述cfDNA样本中的小变异的存在,以及
其中处理所述一组特征包括:
从所述cfDNA样本标识与所述第一个特征相对应的信号,以及
基于与所述第一特征相对应的所述系数输出的幅度来将所述受试者分类到所述癌变组。
10.根据权利要求3所述的方法,其中所述第一子模型包括随机森林模型和梯度提升机中的至少一个。
11.根据权利要求3所述的方法,其中所述第二子模型是多项回归模型,并且其中由所述多项回归模型提供的所述预测包括一组值,每个值指示所述cfDNA样本源自所述候选组织来源集合中的与该值相关联的一个候选组织来源的概率。
12.根据权利要求11所述的方法,其中所述多项回归模型包括阿尔法参数,所述阿尔法参数被配置为在岭回归模式和LASSO回归模式之间调整所述第二子模型的性能,所述方法还包括评估一组小变异特征中的每一个小变异特征对所述预测的贡献,并基于所述贡献来调整所述阿尔法参数。
13.根据权利要求3所述的方法,其中所述第二子模型包括支持向量机,所述支持向量机包括用于相对于所述候选组织来源集合中的其他候选组织来源来评估所述候选组织来源集合中的每一个候选组织来源的架构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格瑞尔公司,未经格瑞尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980084821.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速天然单个细胞质谱分析法
- 下一篇:点焊性优异的镀锌钢板及其制造方法