[发明专利]一种筛选基因芯片差异表达基因的方法无效
申请号: | 200710173586.1 | 申请日: | 2007-12-28 |
公开(公告)号: | CN101215602A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 刘极龙;曾华宗 | 申请(专利权)人: | 上海敏芯信息科技有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 筛选 基因芯片 差异 表达 基因 方法 | ||
技术领域
本专利涉及一种基因芯片数据分析中差异表达基因筛选的一种算法。该算法适用于缺乏重复的小样本的基因芯片实验设计。
背景技术
基因芯片,又称基因微阵列(microarray),是指将许多已知序列寡核苷酸或cDNA片段有规律地排列在基片上,将待测的样品标记后与芯片上的核酸序列按碱基互补配对原则进行杂交。通过荧光检测系统对芯片进行扫描,并配以计算机系统对每一探针上的荧光信号做出检测和比较,可以迅速得出实验结果。利用基因芯片可以在一次实验中对上万种基因的表达水平进行快速、准确、高效地检测,并且样本的需要量可以大大减少。基因芯片技术是目前基因研究方面最先进、也是最有效的方法之一,在生命科学研究及实践、医学科研及临床、药物设计、环境保护、农业、军事等各个领域有着广泛的应用。
差异表达基因的筛选是基因芯片分析最为关键的一步。对于两样本的无重复的芯片数据,可以使用倍数法(Gerhold D,Lu M,Xu J,Austin C,Caskey CT,Rushmore T.Monitoring expression of genesinvolved in drug metabolism and toxicology using DNAmicroarrays.Physiol Genomics 2001;5:161-170)或z-score(Cheadle C,Vawter MP,Freed WJ and Becker KG.Analysis ofmicroarray data using z score trahsformation.J Mol Diagn2003:5,73-81)的方法;对于两样本的有重复的芯片数据则可以使用倍数法或t检验(Baldi P,Long AD.A Bayesian framework for theanalysis of microarray expression data:regularized t-testand statistical inferences of gene changes.Bioinformatics2001;17:509-519)等方法。对于多个分组的有重复的芯片数据则可以使用方差分析(Pavlidis P.Using ANOVA for gene selectionfrom microarray studies of the nervous system.Methods2003:31(4):282-9)。对于长的时间序列一般会使用曲线拟合(StoreyJD,Xiao W,Leek JT,Tompkins RG,Davis RW.Significanceanalysis of time course microarray experiments.Proc Natl AcadSci U S A.2005,102(36):12837-4)的方法。
但是在实际应用中,由于基因芯片的费用昂贵,研究者往往只能负担少量样本的芯片设计(样本量<6),并且每个样本的也只是进行单次或两次技术重复,这种缺乏重复的小样本基因芯片实验设计目前非常很普遍。这类芯片数据目前并没有很好的分析方法,主要是采用倍数法,而倍数法是一种经验算法,算法本身的敏感性与特异性是很难估计的,会引起较大的实验误差。为了弥补这一技术空白,本专利我们提出一种基于统计模型的新算法,来对小样本,无重复的基因芯片产生的差异基因进行筛选。
发明内容
本发明提供一种通过建立统计模型来筛选基因的方法。
本发明是这样实现的,主要包括如下流程:步骤1,对芯片数据进行归一化处理;步骤2,建立对数比值xij=μ+μj+ε线性模型;步骤3,计算出全局均值μ,列效应μj和方差σ的值;步骤4,利用μ、μj和σ,计算每个基因的2×ln(odd ratio);步骤5,设定域值χ2cutoff,n,当步骤4中的2×ln(odd ratio)值大于χ2cutoff,n的基因定为差异表达基因。
注:ln(·)为以e为底的自然对数。
本发明的优点在于:通过建立统计模型,设计适当的统计量,最后使用假设检验的方法赋予每个基因一个显著性的概率数值,作为筛选基因的标准。该方法克服了常规的倍数法缺乏统计学基础和对算法本身敏感性与特异性难以估计的弱点。
附图说明
图1是本发明所述筛选基因芯片差异表达基因的方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海敏芯信息科技有限公司,未经上海敏芯信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710173586.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像形成装置
- 下一篇:翼片、套筒及用于组装燃烧器组件的方法