[发明专利]一种特征lincRNA表达谱组合及子宫内膜癌早期预测方法在审
申请号: | 202010775532.8 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111944900A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 刘大海;李文兴;孙婷婷;刘蕾娜 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;G16B20/20;G16B40/00 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 528000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 lincrna 表达 组合 子宫 内膜 早期 预测 方法 | ||
1.一种特征lincRNA表达谱组合,其特征在于,包括AC008124.1、AC068473.5、AC093297.2、AC104825.1、AL355338.1、AP003486.1、BAIAP2-DT、EIF3J-DT、EPB41L4A-AS1、HEIH、ILF3-DT、LINC00294、LINC00467、LINC00909、LINC01963、MIR22HG、NORAD和OSER1-DT,其核苷酸探针序列如SEQ ID NO.1-18所示。
2.一种基于权利要求1所述的特征lincRNA表达谱组合的子宫内膜癌早期预测方法,其特征在于,包括以下步骤:
步骤1、获取子宫内膜癌早期患者稳定差异表达的特征lincRNA;
步骤2、选取特征lincRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征lincRNA的表达水平进行早期预测;
所述方法为非疾病的诊断和治疗目的。
3.根据权利要求2所述的子宫内膜癌早期预测方法,其特征在于,所述步骤1中的获取子宫内膜癌早期患者稳定差异表达的特征lincRNA,具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载子宫内膜癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得子宫内膜癌患者肿瘤组织基因表达谱readcounts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取具有一定表达丰度的lincRNA,即在所有样本中lincRNA的read counts大于等于10;再对所有lincRNA的read counts取对数,设样本总数为n,筛选后lincRNA总数为m,v为lincRNA的read counts,u为取对数之后的表达值,则有:
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为lincRNA编号,uij为第i个样本、第j个lincRNA编号取对数之后的表达值,vij为第i个样本、第j个lincRNA编号的read counts数值;
步骤1.3、选取疾病分期为I期和II期的子宫内膜癌患者,将这些患者记为子宫内膜癌早期患者,子宫内膜癌早期患者总数记为n′;
步骤1.4、选取肿瘤和正常样本中稳定表达的lincRNA,即在肿瘤和正常样本中变异系数均小于0.2的lincRNA,设μ为所有样本中lincRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为lincRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个lincRNA编号的标准差,μj为第j个lincRNA编号的lincRNA的表达均值,设m1为稳定表达的lincRNA总数,则有:
步骤1.5、选取肿瘤和正常样本中差异表达的lincRNA;使用取对数后的表达值计算肿瘤和正常样本lincRNA取对数后的倍数变化f,公式为:
其中,j为lincRNA编号,fj为第j个lincRNA编号的倍数变化,μ1j为第j个lincRNA编号的肿瘤样本的表达均值,μ2j为第j个lincRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中lincRNA的表达差异,独立样本t检验公式为:
其中,n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本lincRNA表达均值,μ2为正常样本lincRNA表达均值,为肿瘤样本lincRNA方差,为正常样本lincRNA方差;
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个lincRNA中排序后的位置,则有:
其中,j为lincRNA编号,qj代表第j个lincRNA编号的FDR校正后的数值,pj代表第j个lincRNA编号的t检验得出的p值,rj代表第j个lincRNA编号的p值在m1个lincRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的lincRNA,记为特征lincRNA,设特征lincRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010775532.8/1.html,转载请声明来源钻瓜专利网。