[发明专利]一种鼻咽癌分子分型的预测系统有效
申请号: | 202110362236.X | 申请日: | 2021-04-02 |
公开(公告)号: | CN113096730B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 陈明远;林美 | 申请(专利权)人: | 中山大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B30/10;G16B40/00 |
代理公司: | 广州长星专利商标代理事务所(普通合伙) 44662 | 代理人: | 梁桂萍 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 鼻咽癌 分子 预测 系统 | ||
1.一种鼻咽癌分子分型的预测系统,其特征在于,所述的预测系统工作时包括以下步骤:
S1、收集X例鼻咽癌转录组表达矩阵及临床数据;
S2、提取鼻咽癌I型、II型、III型三种不同分子亚型基因表达特征,I、II、III型病例数目分别为a、b、c个,且步骤S1的X=a+b+c;其中I型为高增殖能力及低免疫细胞浸润型,而III型为低增殖能力及高免疫细胞浸润型,II型则介于两者之间;分别检测I型和II型,I型和III型以及II 型和III型的差异表达基因;
S3、将各分子分型的基因表达特征选取为构建分子分型预测模型的特征,其中I、II、III型基因表达特征数目分别为d、e、f个,且d+e+f=Y;
S4、 载入“mlbench”R 包,以患者编码为唯一识别,随机选取X*2/3例患者为训练集,剩下的X*1/3例患者为验证集;
S5、根据选取的患者编码,使用“match”函数将转录组表达矩阵拆分为行名为患者编码,列名为基因名的训练矩阵及验证矩阵,分别存入“train”及“validation”变量中;
S6、载入“caret”R包,使用训练矩阵及对应的分子分型标签,构建备选预测模型;
S7、使用least-group out 方法以75%样本作为训练集进行交叉验证,以准确性作为标准自动挑选分子分型预测模型;
S8、使用构建的分子预测模型预测验证集患者的分子分型,并与实际情况进行对比,绘制受试者工作特征曲线验证其准确性,最终确定预测模型。
2.根据权利要求1所述的一种鼻咽癌分子分型的预测系统,其特征在于,步骤S2中,使用秩和检验分别检测I型和II型,I型和III型以及II 型和III型不同亚型的差异表达基因。
3.根据权利要求1所述的一种鼻咽癌分子分型的预测系统,其特征在于,步骤S3中选取构建子分型预测模型特征时,在有标签的训练集中使用随机森林算法构建分子分型预测模型。
4.根据权利要求1所述的一种鼻咽癌分子分型的预测系统,其特征在于,步骤S6中,构建备选预测模型时,利用train函数,设定算法为随机森林,迭代100次。
5.根据权利要求1所述的一种鼻咽癌分子分型的预测系统,其特征在于,步骤S8中,利用predict函数使用构建的分子预测模型。
6.根据权利要求1所述的一种鼻咽癌分子分型的预测系统,其特征在于,步骤S8中,确定预测模型时,将预测模型保存为“Rdata”形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110362236.X/1.html,转载请声明来源钻瓜专利网。