[发明专利]基于机器学习和多种统计学原理的癌症驱动基因鉴定方法有效
申请号: | 201711496093.1 | 申请日: | 2017-12-31 |
公开(公告)号: | CN108090328B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 刘鹏渊;韩毅;陆燕;周莉媛 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B40/20 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静;邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 多种 统计学 原理 癌症 驱动 基因 鉴定 方法 | ||
本发明公开了一种基于机器学习和多种统计学原理的癌症驱动基因鉴定方法,包括以下步骤:(1)整理数据为标准格式;(2)计算背景变异率;(3)统计学检验癌症驱动基因;(4)蒙特卡洛模拟统计量分布;(5)P值调整。本发明考虑了各个样本、基因和突变类型的背景变异率、多种突变类型对蛋白质功能的影响,采用得分检验来判断驱动基因,具有高稳健性,广泛适用于各类型癌症;并且在敏感性和特异性间达到了较好的平衡,既能检测到较多数量的驱动基因,又能保持较低的假阳性。本发明对于寻找癌症治疗的潜在位点和抗癌药物开发都具有重要意义。
技术领域
本发明属于生物信息学和癌症医学交叉领域,涉及一种采用机器学习和多种统计学方法的癌症驱动基因鉴定方法。
背景技术
癌症大部分是体细胞发生突变所引起的疾病。驱动基因是直接导致癌症发生发展的因素,另一方面,乘客基因和癌症之间没有直接关系,因此有必要把驱动基因鉴定出来。世界几大肿瘤测序工程比如癌症基因组图谱工程(TCGA)、国际癌症基因组协会工程(ICGC)和临床应用研究到一般有效治疗工程(TARGET)已经建立了各种类型癌症体细胞突变的综合目录。这些测序工程的一个主要目的就是鉴定导致癌症的驱动基因。找到癌症驱动基因,不仅能增加人类对肿瘤发生和发展的了解,更能提供一些癌症的潜在治疗靶点。
一些利用多组学数据鉴定癌症驱动基因的生物信息学工具已经问世,这些工具根据他们的基本原理可以分为3类:第一类是以突变频率为基础的工具,他们把突变频率高于背景突变率的基因确定为驱动基因。这类工具的代表是MutSigCV(Lawrence M S,StojanovP,Polak P,et al.Mutational heterogeneity in cancer and the search for newcancer-associated genes.[J].Nature,2013,499(7457):214-218.)和申请号为CN201310284338.X的专利“一种检测非小细胞肺癌驱动基因突变谱的方法及试剂盒与应用”。第二类是根据已知通路或者相互作用网络来开发的工具。此类工具的代表是DawnRank(Hou J P,Ma J.DawnRank:discovering personalized driver genes in cancer[J].Genome Medicine,2014,6(7):56.)和申请号为CN201510111810.9的专利“一种基于生物网络的癌症驱动基因的筛选方法”。第三类是“热点”工具,“热点”是指对肽链或者蛋白质三维构象有重要影响的位置。其代表是OncodriveCLUST(Tamborero D,Gonzalezperez A,Lopezbigas N.OncodriveCLUST:exploiting the positional clustering of somaticmutations to identify cancer genes[J].Bioinformatics,2013,29(18):2238.)。
然而上述生物信息学工具仍存在一些缺点,首先这些算法没有达到敏感性和特异性的良好平衡,即有些算法敏感性虽高,但是特异性过低,抑或是特异性高而敏感性低;其次这些方法对不同类型肿瘤缺乏稳健性,即对一些肿瘤类型,方法性能很好,找到许多可靠的驱动基因,但是对另一些肿瘤类型却表现出较差的性能。
发明内容
本发明旨在提供一种高稳健性算法来鉴定癌症驱动基因。本发明方法以机器学习和多种统计方法为基础,能在多种类型癌症数据上展现出较高的灵敏性和特异性,大大降低传统方法造成的假阳性,为后续基因功能研究和靶向药物筛选打下重要基础。
本发明所提供的技术方案:一种基于机器学习和多种统计学原理的癌症驱动基因鉴定方法,其实现步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711496093.1/2.html,转载请声明来源钻瓜专利网。