[发明专利]一种计算寡核苷酸基因芯片的UniGene表达量的算法无效
申请号: | 200710173615.4 | 申请日: | 2007-12-28 |
公开(公告)号: | CN101261689A | 公开(公告)日: | 2008-09-10 |
发明(设计)人: | 曾华宗;刘极龙 | 申请(专利权)人: | 上海敏芯信息科技有限公司 |
主分类号: | G06N3/12 | 分类号: | G06N3/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 寡核苷酸 基因芯片 unigene 表达 算法 | ||
技术领域
本发明属于生物技术领域,涉及基因芯片方面。
背景技术
Affymetrix公司(Santa Clara,USA)是高密度寡核苷酸基因芯片全球最大的提供商。该公司在制造微阵列的生产过程中结合了化学和半导体技术,使Affymetrix在单个阵列1.25/5.25cm2的硅片上原位合成上百万种寡核苷酸探针。
基因芯片与荧光标记的RNA样本杂交后,使用芯片扫描仪可以读取杂交信号。随后使用Operating software(GCOS)等软件可以做探针水平的背景扣除和归一化处理。然后使用相应的概要算法,即求每个探针集内所有探针的某种平均值,作为最终探针集的表达值。常用的概要算法有:RMA(Bolstad,BM.(2004)Low LevelAnalysis of High-density oligonucleotide array data:Background,normalization and summarization[dissertation].Department of Statistics,University of California at Berkeley),GCRMA(Wu,Z.et.al.(2004)Amodel-based background adjustment for oligonucleotide expressionarrays.J.Am.Stat.Assoc.,99,909-917),PLIER(Affymetrix,Inc.(2005)Technical note:guide to probe logarithmic intensity error(PLIER)estimation),MBEI(Li,C.and Wong,H.W.(2001a)Model-based analysisof oligonucleotide arrays:expression index computation and outlierdetection.Proc.Nat.Acad.Sci.,98,31-36,Li,C and Wong,H.W.(2001b)Model-based analysis of oligonucleotide arrays:model validation,designissues and standard error application.Genome Biol.,2,research0032.1-0032.11)和FARMS(Hochreiter,S.et al.(2006)A newsummarization method for Affymetrix probe level data.Bioinformatics,22,943-949)等。
由于一个基因往往有2个以上的探针集,因此目前的概要算法计算出来的结果,将是一个基因对应多个表达值。这虽然为研究者提供了更为丰富的信息,但同时也使在基因芯片后续的对单个基因的分析过程中让人无所适从。有人将一个基因的不同探针集的表达值取平均值,作为该基因的最终表达值(Breslin T.et al.(2005)Signaltransduction pathway profiling of individual tumor samples.BMC Bioinformatics,6:163)。也有人发现,一个基因的不同探针集的表达值的一致性并不好,使用平均值显得不够合理,于是选择绝对表达值最高的探针集作为一个基因的表达值(Subramanian A.etal.(2005)Gene set enrichment analysis:a knowledge-basedapproach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A,102(43):15545-50)。但是,这种方法对基因水平表达值的估计仍是不够准确的。这里,我们提出一种新的方法,从探针而不是探针集水平入手,采用合适的概要算法,直接求得UniGene的表达值,从而减少了误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海敏芯信息科技有限公司,未经上海敏芯信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710173615.4/2.html,转载请声明来源钻瓜专利网。