[发明专利]一种基于RNA测序的癌症溯源方法在审

专利信息
申请号: 202211567334.8 申请日: 2022-12-07
公开(公告)号: CN115798594A 公开(公告)日: 2023-03-14
发明(设计)人: 方韩;俞容山 申请(专利权)人: 厦门大学
主分类号: G16B40/00 分类号: G16B40/00;G16B30/00;G06F18/2415;G06N3/0464;G06N3/0455;G06N3/08
代理公司: 厦门致群财富专利代理事务所(普通合伙) 35224 代理人: 巫其荣
地址: 361000 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 rna 癌症 溯源 方法
【说明书】:

发明公开了一种基于RNA测序的癌症溯源方法,包括以下步骤:S1、获取癌症数据中的TCGAFRESH数据、TCGAFFPE数据和TCGAMETASTATIC数据,并对癌症数据进行预处理;S2、基于transformer模型搭建癌症溯源网络模型;S3、采用预处理后的TCGAFRESH数据,对癌症溯源网络模型进行训练,得到训练后的癌症溯源网络模型;S4、将预处理后的TCGAFFPE数据和TCGA METASTATIC数据作为测试数据,将两个测试数据集分别送入训练后的癌症溯源网络模型中,对癌症进行分类溯源;本发明将transformer模型应用到了两万维RNA测序数据上,且可以使用所有的基因作为输入,不会存在基因筛选导致的丢失原始基因信息的问题,可有效提高癌症溯源分类的精确度。

技术领域

本发明涉及肿瘤溯源技术领域,具体涉及一种基于RNA测序的癌症溯源方法。

背景技术

不明原发性癌症(Cancerofunknownprimary,CUP)是一种转移性肿瘤,是指尽管进行了标准的诊断检查,但仍然无法找到原发部位的一种疾病。如果不能准确了解患者的原发癌症部位,就不能对患者采取针对性的治疗方法,导致患者不能得到有效的治疗,让患者处于不利地位。所以,准确识别出癌症的原发部位对于患者的治疗是至关重要的。

目前,各种癌症溯源的方法所采用的数据种类有很多,比如基因表达数据、DNA甲基化数据等等。其中,基于RNA测序数据的方法主要有SCOPE、CUP-AI-Dx、TOD-CUP等等。由于RNA测序数据达到了上万维,这种具有高维特征的特性使得设计合适的机器学习方法变得困难。现有的多种机器学习方法存在模型简单或丢失原始基因信息的问题,比如SCOPE使用简单的全连接网络来预测癌症类别,而简单的全连接网络可能无法有效地捕获基因之间的相互作用关系,这在一定程度上会影响分类性能。CUP-AI-Dx将卷积模块引入到了网络中,在网络设计上具有一定的创新,但是CUP-AI-Dx并不是使用了所有基因,而是提前进行了筛选,这种方法会导致一定程度上丢失原始的基因信息,影响分类性能。因此,为了进一步提升癌症分类的精确度,可以采用更强大的网络结构以有效捕获基因间的相互作用关系,同时使用所有的基因,避免基因筛选带来的丢失原始基因信息的问题。

发明内容

本发明的目的在于提供一种基于RNA测序的癌症溯源方法。

为实现上述目的,本发明采用以下技术方案:

一种基于RNA测序的癌症溯源方法,包括以下步骤:

S1、获取癌症数据中的TCGAFRESH数据、TCGAFFPE数据和TCGA METASTATIC数据,并对癌症数据进行预处理;

S2、基于transformer模型搭建癌症溯源网络模型;

S3、采用预处理后的TCGAFRESH数据,对癌症溯源网络模型进行训练,得到训练后的癌症溯源网络模型;

S4、将预处理后的TCGAFFPE数据和TCGAMETASTATIC数据作为测试数据,将两个测试数据集分别送入训练后的癌症溯源网络模型中,对癌症进行分类溯源。

优选地,步骤S1的具体过程为:

S11、从肿瘤基因组图谱TCGA中,获取TCGAFRESH数据、TCGAFFPE数据和TCGAMETASTATIC数据,癌症类型一共为32种;其中,TCGAFRESH数据和TCGAFFPE数据采样来自原发灶,TCGAMETASTATIC数据采样来自转移灶,三种数据的格式都为FPKM;

S12、对于每个基因g,如果有一半以上的样本的基因g的表达值为0,则将该基因g删除;再对处理后的所有样本的基因数据进行log转换,具体操作为log(t+1),得到转换后的数据,其中t为基因g的表达值;

S13、对每个癌型分配一个标签,一共有32种癌型,标签数从0到31,每个癌型对应一个数字标签;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211567334.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top