[发明专利]一种特征miRNA表达谱组合及肺鳞癌早期预测方法在审
申请号: | 202010770157.8 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111793692A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 高跃东;李文兴 | 申请(专利权)人: | 中国科学院昆明动物研究所 |
主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;G16B25/10;G16B35/00;G16B5/00;G16B40/00;G16H50/20 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 650000 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 mirna 表达 组合 肺鳞癌 早期 预测 方法 | ||
1.一种用于预测早期肺鳞癌的特征miRNA表达谱组合,其特征在于,包括hsa-let-7a-1,hsa-let-7a-2,hsa-let-7a-3,hsa-let-7b,hsa-let-7i,hsa-mir-101-1,hsa-mir-101-2,hsa-mir-103a-1,hsa-mir-103a-2,hsa-mir-10a,hsa-mir-126,hsa-mir-143,hsa-mir-146b,hsa-mir-181a-2,hsa-mir-182,hsa-mir-183,hsa-mir-22,hsa-mir-23a,hsa-mir-23b,hsa-mir-26a-1,hsa-mir-26a-2,hsa-mir-26b,hsa-mir-27a,hsa-mir-27b,hsa-mir-29a,hsa-mir-30a,hsa-mir-30d,hsa-mir-30e,hsa-mir-374a,hsa-mir-99b,其核苷酸序列如SEQ ID NO.1-30所示。
2.一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,其特征在于,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测;
该方法用于非疾病的诊断和治疗目的。
3.根据权利要求2所述的预测方法,其特征在于,所述步骤1中的获取肺鳞癌早期患者稳定差异表达的miRNA具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱read counts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取在所有样本中miRNA的read counts大于等于10的miRNA,再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的read counts,u为取对数之后的表达值,则有;
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts数值;
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
m1=m{cvj≥10},j∈(1,m) (3)
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
fj=μ1j-μ2j,j∈(1,m1) (4)
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
其中n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本miRNA表达均值,μ2为正常样本miRNA表达均值,为肿瘤样本miRNA方差,为正常样本miRNA方差;
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院昆明动物研究所,未经中国科学院昆明动物研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010770157.8/1.html,转载请声明来源钻瓜专利网。