[发明专利]肿瘤分子分型方法及装置、终端设备及可读存储介质有效
申请号: | 202110374936.0 | 申请日: | 2021-04-08 |
公开(公告)号: | CN112766428B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 周杨;赵义;方璐;杨滢;何骥;杜波 | 申请(专利权)人: | 臻和(北京)生物科技有限公司;臻和精准医学检验实验室无锡有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16B40/30 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 王巍巍 |
地址: | 100191 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 肿瘤 分子 方法 装置 终端设备 可读 存储 介质 | ||
1.一种肿瘤分子分型方法,其特征在于,包括:
获取多个肿瘤组织样本的测序数据,并基于预先构建的覆盖深度基线计算各基因的拷贝数数值;
根据预设的拷贝数变异数阈值和计算得到的拷贝数数值筛选各肿瘤组织样本中发生变异的基因;
基于筛选的发生变异的基因的拷贝数数值对肿瘤组织样本进行无监督聚类得到针对不同变异特征的多个样本类别;
筛选各样本类别样本间基因拷贝数变异达到预设差异的基因;
针对筛选得到的基因进一步进行无监督聚类得到针对不同变异特征的多个基因类别;
基于拷贝数变异分别计算各基因类别中基因的第一主成分,并通过回归分析的方法确定各基因类别第一主成分对患者预后的影响;
根据基因第一主成分对患者预后的影响计算各肿瘤组织样本的拷贝数变异分值CNVscore,并根据无监督聚类结果和拷贝数变异分值CNV score进一步对各样本类别的样本进行分类,完成对肿瘤的分子分型;其中,拷贝数变异分值CNV score为:
其中,
分别对各基因类别中包含基因的第一主成分进行回归分析确定相关方向;
根据确定的相关方向确定回归系数方向;
根据回归系数的方向确定各基因类别中基因拷贝数变异的第一主成分对患者预后的影响;其中,当回归系数为负方向,表示相应基因利于患者预后;当回归系数为正方向,表示相应基因不利于患者预后;
所述根据无监督聚类结果和拷贝数变异分值CNV score进一步对各样本类别的样本进行分类,完成对肿瘤的分子分型中,包括:
根据计算得到的拷贝数变异分值CNV score、通过遍历的方法选定基因拷贝数变异分值阈值,使得同一样本类别中不同分组的肿瘤组织样本对应患者的预后差异最大;
根据选定的基因拷贝数变异分值阈值分别对各样本类别中的肿瘤组织样本进行亚组细分,完成对肿瘤的分子分型。
2.如权利要求1所述的肿瘤分子分型方法,其特征在于,
在所述基于选定基因的拷贝数数值对肿瘤组织样本进行无监督聚类得到针对不同变异特征的多个样本类别及在所述针对筛选得到的基因进一步进行无监督聚类得到针对不同变异特征的多个基因类别中,均采用PAM算法进行无监督聚类,并通过轮廓系数确定最优聚类数目;
和/或在所述筛选各样本类别样本间基因拷贝数变异达到预设差异的基因中,采用秩和检验的方法筛选各样本类别样本间基因拷贝数变异达到预设差异的基因,其中,当秩和检验p值小于预设阈值,确定相应基因达到预设差异。
3.如权利要求1所述的肿瘤分子分型方法,其特征在于,所述基于选定基因的拷贝数数值对肿瘤组织样本进行无监督聚类得到针对不同变异特征的多个样本类别中,包括:
对各选定基因的拷贝数数值进行z-score标准化处理;
基于计算得到z-score值对肿瘤组织样本进行无监督聚类得到针对不同变异特征的多个样本类别。
4.如权利要求1所述的肿瘤分子分型方法,其特征在于,所述获取多个肿瘤组织样本的测序数据,基于预先构建的覆盖深度基线得到各基因的拷贝数数值中,包括:
获取多个肿瘤组织样本的测序数据并对其进行预处理操作;
根据健康人的白细胞测序数据为每个基因捕获区域构建覆盖深度基线;
根据预处理操作后的肿瘤组织样本测序数据计算每个基因捕获区域的覆盖深度;
依次计算各基因捕获区域的拷贝数数值,其中,针对一基因捕获区域,基于该基因捕获区域在肿瘤组织样本中的覆盖深度和构建的覆盖深度基线比值的log2转化值计算得到拷贝数数值;
根据计算得到的基因捕获区域的拷贝数数值得到基因的拷贝数数值,其中,针对一基因,其拷贝数数值由该基因覆盖的所有基因捕获区域的拷贝数数值的集中趋势计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于臻和(北京)生物科技有限公司;臻和精准医学检验实验室无锡有限公司,未经臻和(北京)生物科技有限公司;臻和精准医学检验实验室无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110374936.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:燃料电池
- 下一篇:实现数据可视化及数据整合ETL的解决方法及系统