[发明专利]一种基于血浆中循环RNA全转录组测序的肺癌特征识别方法、装置和存储介质在审
申请号: | 202310248153.7 | 申请日: | 2023-03-08 |
公开(公告)号: | CN116312800A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 李青娇;刘宇琳;梁茵 | 申请(专利权)人: | 中山大学附属第八医院(深圳福田) |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/10;G16B50/00;G16H50/70;G06F18/214;G06F18/2431 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 余凯欢 |
地址: | 518033 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 血浆 循环 rna 转录 组测序 肺癌 特征 识别 方法 装置 存储 介质 | ||
1.一种基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述基于血浆中循环RNA全转录组测序的肺癌特征识别方法包括:
获取与非小细胞肺癌相关的cfRNA标志物信息;所述cfRNA标志物信息通过基于血浆中循环RNA全转录组测序得到;
从所述cfRNA标志物信息中选择出顶级特征信息;
根据所述顶级特征信息构建和训练预测模型;
使用训练好的所述预测模型进行非小细胞肺癌特征识别。
2.根据权利要求1所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述获取与非小细胞肺癌相关的cfRNA标志物信息,包括:
从高通量测序数据库中获取cfRNA原始测序数据;所述cfRNA原始测序数据来自非小细胞肺癌患者和对照样本;
对所述cfRNA原始测序数据进行数据清理和数据比对,获得所述cfRNA标志物信息。
3.根据权利要求2所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述数据清理,包括:
去除所述cfRNA原始测序数据中的reads 3’端的低质量碱基序列;所述低质量碱基序列包括满足Quality Phred score cutoff≤20的碱基序列;
在所述cfRNA原始测序数据中的reads的3’端查找并去除人为添加物;所述人为添加物包括序列中加入的引物和接头。
4.根据权利要求2所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述数据比对,包括:
将经过数据清理后的所述cfRNA原始测序数据与人类参考基因组进行比对;
对所述cfRNA原始测序数据去除PCR重复;
量化所述cfRNA原始测序数据的RNA的丰度。
5.根据权利要求1所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述从所述cfRNA标志物信息中选择出顶级特征信息,包括:
使用偏最小二乘判别分析算法对所述cfRNA标志物信息进行选择,获得预测中的变量重要性;
选择出对应的所述变量重要性大于临界值的所述cfRNA标志物信息,作为所述顶级特征信息。
6.根据权利要求1-5任一项所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述根据所述顶级特征信息构建和训练预测模型,包括:
对所述顶级特征信息组成的数据集进行多次划分,每次划分分别产生相应的训练集和测试集;同一次划分所得的所述训练集和测试集之间不重叠;
建立多个预测模型;各所述预测模型与各所述训练集之间一一对应;
分别使用每个所述训练集训练相应的一个所述预测模型;
分别使用每个所述测试集测试相应的一个所述预测模型;
对测试完的各所述预测模型进行性能评估;
保存性能评估指标符合要求的所述预测模型。
7.根据权利要求6所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述预测模型为逻辑回归模型或者随机森林模型。
8.根据权利要求7所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法,其特征在于,所述根据所述顶级特征信息构建和训练预测模型,还包括:
对所述顶级特征信息组成的数据集进行重划分,获得独立验证集;
使用所述独立验证集对所述预测模型进行验证,确定各所述顶级特征信息的重要性;
根据对应的重要性,对各所述顶级特征信息进行排序;
记录排在最前的若干个所述顶级特征信息的类型。
9.一种计算机装置,其特征在于,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行权利要求1-8任一项所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行权利要求1-8任一项所述的基于血浆中循环RNA全转录组测序的肺癌特征识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学附属第八医院(深圳福田),未经中山大学附属第八医院(深圳福田)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310248153.7/1.html,转载请声明来源钻瓜专利网。