[发明专利]一种利用测序技术分析猪乳腺组织基因表达差异的方法无效
申请号: | 201110385816.7 | 申请日: | 2011-11-29 |
公开(公告)号: | CN102409099A | 公开(公告)日: | 2012-04-11 |
发明(设计)人: | 彭静;张立凡;王颖;徐宁迎 | 申请(专利权)人: | 浙江大学 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 周烽 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用测序技术分析猪乳腺组织基因表达差异的方法,分别构建了金华猪和大约克猪乳腺组织cDNA的文库并用基因组分析仪进行测序,采用Cufflinks软件预测了新的转录本信息;在此基础上还对两样本测序结果进行了比较分析,包括基因差异表达分析和差异表达基因的GeneOntology分析;本发明公开了金华猪和大约克猪乳腺组织转录组测序的过程和结果,并对这些序列信息进行了深入的统计分析和比较,以期为深入研究猪泌乳发育、泌乳过程中相关的基因功能和调控机制提供基础材料。 | ||
搜索关键词: | 一种 利用 技术 分析 乳腺 组织 基因 表达 差异 方法 | ||
【主权项】:
一种利用测序技术分析猪乳腺组织基因表达差异的方法,其特征在于,该方法包括以下步骤:(1)总RNA 的提取:金华猪和大约克猪屠宰后,采集乳腺组织样本,研钵置于高压灭菌锅中灭菌,然后将乳腺组织样本放入研钵,倒入液氮,将乳腺组织样本研磨成粉末状态;然后取样品粉末50‑100mg,移至已加入1ml Trizol试剂的2ml离心管中并混匀,室温条件下静置5‑10min,让样品中核蛋白混合物完全裂解;在离心管中加入200ul氯仿,剧烈震荡15秒后,室温条件下静置2‑3min;然后放入离心机中,4℃、13000rpm离心15min,上层无色水相为RNA,下层红色是酚、氯仿层;吸取上层无色水相至一新的离心管中,加入500ul异丙醇(沉淀RNA),室温条件下静置10min;然后4℃、13000rpm离心10min,RNA被沉淀,呈胶状颗粒;弃上清,加入1ml用DEPC水配置的体积百分比浓度为75%酒精,旋转管子混匀;4℃、10000rpm离心5min;弃乙醇,沉淀物在室温条件下干燥5‑10min;加入50ul 体积百分比浓度为0.1%的DEPC水溶解RNA;(2)构建组织RNA‑Seq测序cDNA文库,采用Illumina Satandard Kit 试剂盒,cDNA文库的制备主要包括以下子步骤:(2.1)mRNA分离和片段化;用poly(T)寡聚核苷酸从上述2个总RNA池中抽取带poly(A)尾的RNA,其中的主要部分就是编码基因所转录的mRNA,然后将所得的mRNA用裂解液在70摄氏度下裂解5分钟;(2.2)cDNA合成与末端修复;利用N6随机引物和反转录酶将片段化的mRNA合成cDNA一链,随后用RNaseH和DNA多聚酶再将一链cDNA合成双链cDNA,然后利用T4DNA多聚酶和KlenowDNA多聚酶对二链cDNA进行末端修饰;(2.3)连接5′和3′测序接头;用Illumina adaptor mix和T4DNA酶将上述经过末端修饰的cDNA连接到Illumina双端测序接头上,这样得到将用于测序的cDNA;(2.4)PCR扩增cDNA文库;在以上过程,将RNA随机片段化和采用随机引物进行反转录,都是为了使所得cDNA片段较均匀地取自各个转录本,为了提高测序效率,一般采用电泳切胶法(琼脂糖凝胶的质量体积比浓度为0.02g/ml),获取长度范围在200‑250bp的cDNA片段,再经过15个循环的PCR线性扩增后,最后用QIAquick PCR purification KIT试剂盒富集和纯化得到最终的cDNA文库;(3)采用Illumina GAⅡX测序仪器对建库产物进行测序:上述纯化好的cDNA文库放进基因组分析泳道中,采用边合成边测序法,利用Illumina GA Ⅱx测序平台进行5′和3′双向75nt长度RNA‑Seq测序,每个通道将产生数百万条原始的读段(Read),Read的测序读长为75bp;(4)RNA‑Seq数据的基本处理,该步骤包括以下子步骤:(4.1)将测序数据定位到参考基因组:获得RNA‑Seq的原始数据后,首先需要将所有测序读段通过序列映射定位到Ensembl数据库的猪基因组上,这需要使用TopHat软件以及Bowtie软件共同来完成;首先,通过Bowtie采用Burrows‑Wheeler转换将猪基因组按照一定规则压缩并建立索引,然后采用Tophat软件来查找和回溯来定位读段;不过在读段定位之前,需要按照Illumina标准程序对读段进行质量过滤,Tophat允许每个读段多重比对,并且可以允许最多出现2个缺省的错配;定位的结果接着被用于鉴定可以表达的“islands”,这也就是潜在的外显子;如果存在有些读段不能直接定位到参考基因组上,那么就会将这些读段与Tophat数据库中公认的结合位点进行比对,从而可以签订出潜在的外显子结合位点;最后,读段定位到基因组后采用SAM格式来存储,而鉴定的结合位点会以BED文件保存;(4.2)转录本签订上述凭借好的序列会进一步使用Cuffinks软件来预测新的转录本;RNA‑Seq数据能在一定程度上推断对于每一个转录本的表达水平,并检测其在不同样品间的差异表达和调控;因为Cuffinks软件可以不依赖一致参考基因的转录本去预测未知的、潜在的新的转录本,这就使得Cuffinks软件可以应用于位置物种选择性剪切和转录本的鉴定;预测的转录本会存储在以transcript.expr命名的文件夹里,而签订的基因则会储存在以genes.expr命名的文件夹下面;用FPKM进行基因表达估计,FPKM就是每百万读段中来自于某基因外显子每千碱基长度的读段数,公式表示为:FPKM=(基因区段计数/基因长度*测序深度)*109;最后预测的转录本和他们相关的外显子会形成GTF格式文件,并被储存在transcript.gtf文件夹下面;(4.3)基因和转录本注释:一旦所有的读段序列用Cuffinks软件进行组合后,组合转录本的GTF文件将和参考基因组一起进行比对;利用Cuffinks软件中得Cuffcompare模块可以对每个转录本是已知或未知进行分类;这样,所有的转录本包括与参考基因组匹配的(class‑code:u or ‑)或者包含在参考基因组内的(class‑code:c)以及发现新的转录本亚型(class‑code;j)和潜在的新的转录本(class‑code:u or ‑)都会被签订出来;一份包括所有预测的转录本和参考转录本的组合文件将会生成并被存储在_combined.gtf文件下面;(5)比较两种样本中基因表达的差异:用金华猪乳腺组织中FPKM值与大约克猪乳腺组织中FPKM值的比值的绝对表达倍数来表示金华猪和大约克猪乳腺组织中差异基因表达水平;(6)差异表达基因的GO分析:基因功能聚类分析采用GO方法分析,使用功能基因注释软件包bioconducter分析组织中功能相关基因表达变化;一般来说,单个基因的表达情况的改变不能完全反应特定细胞功能和通路的整体变化情况;因为生物个体的细胞功能的实现并不仅仅是依靠一两个基因功能的改变来实现的;而基因本体(Gene Ontology,GO),也就是一套与基因有关的树状的词汇表的引入为基因功能数据挖掘提供了新的思路;GO分析主要目的在于发掘出与基因差异表达现象关联的特征基因功能类的组合;GO分析是根据挑选出的有注释的差异基因,计算这些差异基因同GO分类中某个特定的分支的超几何分布关系;通过GO分析可以找到富集差异基因的GO分类条目,寻找不同样品间的差异基因可能和那些基因功能的改变有关。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110385816.7/,转载请声明来源钻瓜专利网。