[发明专利]基于随机丢弃的肿瘤分子分型方法及系统在审
申请号: | 202111413309.X | 申请日: | 2021-11-25 |
公开(公告)号: | CN114141305A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 薛宇;林少峰;张玮之 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/00;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 许恒恒 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 丢弃 肿瘤 分子 方法 系统 | ||
1.一种基于随机丢弃的肿瘤分子分型方法,其特征在于,包括以下步骤:
(S1)组学数据的预处理:
针对预先选定的肿瘤类型,收集若干位患该类肿瘤的肿瘤患者数据,得到每位肿瘤患者其癌与癌旁组织在预先选定的组学层面的表达数据,并通过癌与癌旁的表达数据对比获得每一种组学层面下的差异特征分子;
其中,所述预先选定的组学层面为转录组、蛋白质组、蛋白修饰组以及代谢组中的一者;
(S2)初始分型的获得:
对所述步骤(S1)得到的所述差异特征分子分别进行编码,得到分子特征输入矩阵;
然后,通过预先选定的用于分子分型的若干种聚类方法及预先选定的若干种距离计算方法的排列组合,计算潜在分子亚型;
接着,对计算得到的每一个潜在分子亚型进行分型评估,取评估结果最佳者作为初始分型,同时分别记该初始分型所对应的聚类方法及距离计算方法为初始分型的聚类方法及初始分型的距离计算方法;
(S3)随机丢弃迭代以优化分型:
对所述差异特征分子进行随机丢弃,并相应得到随机丢弃后的分子特征输入矩阵;
同时,采用所述初始分型的聚类方法及初始分型的距离计算方法,基于随机丢弃后的分子特征输入矩阵,计算新分子亚型;
然后,对所述新分子亚型进行分型评估,若评估结果相较于所述初始分型的评估结果有变优或维持不变,则保留本次的丢弃,同时以该新分子亚型对所述初始分型进行赋值更新;若评估结果相较于所述初始分型的评估结果有变劣,则取消本次的丢弃;
如此重复随机丢弃,迭代运算,直到评估结果波动满足预先设定的要求或者迭代次数达到预先设定的要求;相应的,迭代结束后的所述初始分型即为优化后的分型结果。
2.如权利要求1所述方法,其特征在于,所述步骤(S1)中,所述收集若干位患该类肿瘤的肿瘤患者数据,具体是收集至少20位患该类肿瘤的肿瘤患者数据。
3.如权利要求1所述方法,其特征在于,所述步骤(S2)中,所述预先选定的用于分子分型的若干种聚类方法,选自于一致性聚类(Consensus clustering)和非负矩阵分解(Non-negative matrix factorization,NMF)。
4.如权利要求1所述方法,其特征在于,所述步骤(S2)中,所述预先选定的用于分子分型的若干种聚类方法,选自于一致性聚类,具体包括:K均值聚类(k-means,KM)、分层聚类(hierarchical clustering,HC)、围绕中心点的划分算法(partitioning around medoid,PAM)聚类;
其中,对于所述分层聚类(hierarchical clustering,HC)和所述围绕中心点的划分算法(partitioning around medoid,PAM)聚类,预先选定的若干种距离计算方法,选自:pearson距离、spearman距离、euclidean距离、binary距离、maximum距离、canberra距离、minkowski距离;
对于所述K均值聚类(k-means,KM),预先选定的若干种距离计算方法为欧氏距离(Euclidean distance)。
5.如权利要求1所述方法,其特征在于,所述分型评估是利用分型与临床指标的相关性进行显著性分析实现的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111413309.X/1.html,转载请声明来源钻瓜专利网。