[发明专利]一种基于RNA测序的癌症溯源方法在审
申请号: | 202211567334.8 | 申请日: | 2022-12-07 |
公开(公告)号: | CN115798594A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 方韩;俞容山 | 申请(专利权)人: | 厦门大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B30/00;G06F18/2415;G06N3/0464;G06N3/0455;G06N3/08 |
代理公司: | 厦门致群财富专利代理事务所(普通合伙) 35224 | 代理人: | 巫其荣 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rna 癌症 溯源 方法 | ||
本发明公开了一种基于RNA测序的癌症溯源方法,包括以下步骤:S1、获取癌症数据中的TCGAFRESH数据、TCGAFFPE数据和TCGAMETASTATIC数据,并对癌症数据进行预处理;S2、基于transformer模型搭建癌症溯源网络模型;S3、采用预处理后的TCGAFRESH数据,对癌症溯源网络模型进行训练,得到训练后的癌症溯源网络模型;S4、将预处理后的TCGAFFPE数据和TCGA METASTATIC数据作为测试数据,将两个测试数据集分别送入训练后的癌症溯源网络模型中,对癌症进行分类溯源;本发明将transformer模型应用到了两万维RNA测序数据上,且可以使用所有的基因作为输入,不会存在基因筛选导致的丢失原始基因信息的问题,可有效提高癌症溯源分类的精确度。
技术领域
本发明涉及肿瘤溯源技术领域,具体涉及一种基于RNA测序的癌症溯源方法。
背景技术
不明原发性癌症(Cancerofunknownprimary,CUP)是一种转移性肿瘤,是指尽管进行了标准的诊断检查,但仍然无法找到原发部位的一种疾病。如果不能准确了解患者的原发癌症部位,就不能对患者采取针对性的治疗方法,导致患者不能得到有效的治疗,让患者处于不利地位。所以,准确识别出癌症的原发部位对于患者的治疗是至关重要的。
目前,各种癌症溯源的方法所采用的数据种类有很多,比如基因表达数据、DNA甲基化数据等等。其中,基于RNA测序数据的方法主要有SCOPE、CUP-AI-Dx、TOD-CUP等等。由于RNA测序数据达到了上万维,这种具有高维特征的特性使得设计合适的机器学习方法变得困难。现有的多种机器学习方法存在模型简单或丢失原始基因信息的问题,比如SCOPE使用简单的全连接网络来预测癌症类别,而简单的全连接网络可能无法有效地捕获基因之间的相互作用关系,这在一定程度上会影响分类性能。CUP-AI-Dx将卷积模块引入到了网络中,在网络设计上具有一定的创新,但是CUP-AI-Dx并不是使用了所有基因,而是提前进行了筛选,这种方法会导致一定程度上丢失原始的基因信息,影响分类性能。因此,为了进一步提升癌症分类的精确度,可以采用更强大的网络结构以有效捕获基因间的相互作用关系,同时使用所有的基因,避免基因筛选带来的丢失原始基因信息的问题。
发明内容
本发明的目的在于提供一种基于RNA测序的癌症溯源方法。
为实现上述目的,本发明采用以下技术方案:
一种基于RNA测序的癌症溯源方法,包括以下步骤:
S1、获取癌症数据中的TCGAFRESH数据、TCGAFFPE数据和TCGA METASTATIC数据,并对癌症数据进行预处理;
S2、基于transformer模型搭建癌症溯源网络模型;
S3、采用预处理后的TCGAFRESH数据,对癌症溯源网络模型进行训练,得到训练后的癌症溯源网络模型;
S4、将预处理后的TCGAFFPE数据和TCGAMETASTATIC数据作为测试数据,将两个测试数据集分别送入训练后的癌症溯源网络模型中,对癌症进行分类溯源。
优选地,步骤S1的具体过程为:
S11、从肿瘤基因组图谱TCGA中,获取TCGAFRESH数据、TCGAFFPE数据和TCGAMETASTATIC数据,癌症类型一共为32种;其中,TCGAFRESH数据和TCGAFFPE数据采样来自原发灶,TCGAMETASTATIC数据采样来自转移灶,三种数据的格式都为FPKM;
S12、对于每个基因g,如果有一半以上的样本的基因g的表达值为0,则将该基因g删除;再对处理后的所有样本的基因数据进行log转换,具体操作为log(t+1),得到转换后的数据,其中t为基因g的表达值;
S13、对每个癌型分配一个标签,一共有32种癌型,标签数从0到31,每个癌型对应一个数字标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211567334.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种茶叶技能综合培训系统
- 下一篇:一种抓斗船抓斗机构及液压控制系统