[发明专利]一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型在审
申请号: | 202111230642.7 | 申请日: | 2021-10-22 |
公开(公告)号: | CN113981081A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 王金凯;郭文冰 | 申请(专利权)人: | 中山大学 |
主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;C12N15/11;G06F30/27;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;郝传鑫 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rna 编辑 水平 乳腺癌 分子 标志 诊断 模型 | ||
1.一种基于RNA编辑水平的乳腺癌分子标志物,其特征在于,以人类参考基因组hg19为基准,所述分子标志物包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。
2.如权利要求1所述的分子标志物,其特征在于,所述分子标志物的RNA编辑位点的编辑水平在乳腺癌中异常增高。
3.如权利要求1所述的分子标志物在制备检测乳腺癌的产品中的应用。
4.如权利要求3所述的应用,其特征在于,所述产品采用多重PCR方法或高通量测序的方法检测样本的RNA编辑位点的编辑水平。
5.一种基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,包括以下步骤:
(1)获取乳腺癌患者和正常组织样本的RNA编辑水平数据,得到每行为分析样本,每列为RNA编辑位点的编辑水平信息的二维矩阵;
(2)剔除未检测到RNA编辑水平的位点;
(3)根据特征重要性筛选候选RNA编辑位点;
(4)将步骤(3)筛选出的RNA编辑位点作为特征,利用随机森林算法进行拟合,构建乳腺癌诊断模型。
6.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,所述步骤(2)的剔除的未检测到RNA编辑水平的位点为在20%及以上的样本中未检测到RNA编辑水平的位点。
7.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,所述步骤(3)的筛选候选RNA编辑位点,具体包括:
(1)在步骤(2)保留下来的RNA编辑位点中,采用R软件包DMwR2的knnImputation函数进行缺失值的插补;
(2)以样本类别(乳腺癌、正常)作为唯一标识,使用R软件包h2o的splitFrame函数随机选取2/3的样本作为训练集,剩下的1/3样本为验证集;
(3)在训练集中,基于步骤(1)中插补后的所有RNA编辑位点,利用随机森林算法建模,以评价每个特征的重要性;
(4)使用R软件包h2o的varimp函数获取每个RNA编辑位点对于乳腺癌检测的重要性;
(5)筛选重要性高于0.01的RNA编辑位点。
8.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,所述步骤(3)筛选出的重要性RNA编辑位点包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。
9.一种如权利要求5~8任一项所述方法构建的基于RNA编辑水平的乳腺癌诊断模型。
10.如权利要求9所述的诊断模型在制备预测乳腺癌的产品中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111230642.7/1.html,转载请声明来源钻瓜专利网。