[发明专利]一种特征lincRNA表达谱组合及肝癌早期预测方法在审
申请号: | 202010775208.6 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111748632A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 贺轲;李文兴;向国安 | 申请(专利权)人: | 广东省第二人民医院(广东省卫生应急医院) |
主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;G16B25/10;G16B35/00;G16B5/00;G16B40/00;G16H50/20 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 510220 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 lincrna 表达 组合 肝癌 早期 预测 方法 | ||
本发明公开了一种特征lincRNA表达谱组合及肝癌早期预测方法,所述lincRNA表达谱组合的核苷酸序列如SEQ ID NO.1‑16所示。本发明的预测方法具有很高的精确度和准确率(ROC曲线下面积AUC=0.971)。只需要获取上述16种lincRNA的相对表达量,通过支持向量机模型计算给出肝癌早期患病概率,可作为肝癌早期预测的参考依据。
技术领域
本发明属于生物技术和医学技术领域,具体地说,涉及一种特征lincRNA表达谱组合及肝癌早期预测方法。
背景技术
肝癌是中国及全球高发的恶性肿瘤,在中国等发展中国家的发病率和死亡普遍高于发达国家。全球范围内男性肝癌的发病率和死亡率均高于女性。肝癌可分为原发性和继发性两大类。原发性肝癌是我国高发的,危害极大的恶性肿瘤。全球疾病负担(GlobalBurden of Disease,GBD)数据显示,2017年全球患有肝癌的人数达到80万,其中中国患病人数高达57万。2017年全球肝癌患者的死亡人数约为82万,占总死亡人数的1.46%。中国2017年死亡患者约为42万,占总死亡人数的4.00%。统计结果显示,从1990年到2017年全球肝癌患病率和死亡率持续增长,中国患病率和死亡率也持续增长且增长趋势和全球增长趋势相对一致。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。当训练数据是线性可分时,SVM通过硬间隔最大化学习进行分类。当训练数据线性不可分时,SVM通过使用核技巧以及软间隔最大化学习进行分类。SVM对于特征含义相似的中等大小的数据集很强大,也适用于小型数据集。通常情况下,对样本量小于1万的数据集SVM都有很好的预测效果。SVM在疾病诊断、肿瘤分类、肿瘤基因识别等有着广泛的应用。
肿瘤早期诊断一直是医学界的难题。现有的早期诊断方法多是观测某一个或一类标志物的表达水平,难以达到理想的诊断效果。由于这些标志物在肿瘤患者和正常人群中的表达分布有部分重叠,难以界定标志物的临界值将肿瘤患者和正常人群较好地分开。因此,利用多个标志物表达特征组合可能是肿瘤早期诊断的一种有效方法。长链基因间非编码RNA(long intergenic non-coding RNA,lincRNA)是一类位于基因间非编码序列的长度大于200个核苷酸的非编码单链RNA分子。lincRNA不具有编码潜力并且在不同物种之间不保守。研究表明lincRNA参与多个基因的表达调控,在人体内表达相对稳定且容易检测。由于单个lincRNA分子在肿瘤和正常人群中表达分布有重叠,难以界定早期诊断的临界值。
因此,有必要建立一种有助于肝癌的早期预测的更稳定的多个差异lincRNA表达特征组合的诊断模型。
发明内容
有鉴于此,本发明针对上述的问题,提供了一种特征lincRNA表达谱组合及肝癌早期预测方法。
为了解决上述技术问题,本发明公开了一种特征lincRNA表达谱组合,包括AC005332.5、AC009283.1、AC078846.1、AC090114.2、AF117829.1、AL392172.1、AP002360.1、AP003469.4、BAIAP2-DT、LINC00261、LINC01963、LINC02001、MALAT1、MAPKAPK5-AS1、MIR4435-2HG和MUC20-OT1,其核苷酸序列如SEQ ID NO.1-16所示。
本发明还公开了一种基于上述的特征lincRNA表达谱组合的肝癌早期预测方法,包括以下步骤:
步骤1、获取肝癌早期患者稳定差异表达的特征lincRNA;
步骤2、选取特征lincRNA表达数据,对每个样本进行数据标准化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省第二人民医院(广东省卫生应急医院),未经广东省第二人民医院(广东省卫生应急医院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010775208.6/2.html,转载请声明来源钻瓜专利网。