[发明专利]一种人类大脑基因表达时空常模的建立方法有效
申请号: | 201910664819.0 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110349625B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 王晶;郭黎媛;林葳 | 申请(专利权)人: | 中国科学院心理研究所 |
主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B5/00;G16B40/00;G16B50/30 |
代理公司: | 北京东方芊悦知识产权代理事务所(普通合伙) 11591 | 代理人: | 彭秀丽 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人类 大脑 基因 表达 时空 常模 建立 方法 | ||
1.一种人类大脑基因表达时空常模的建立方法,其特征在于,所述方法包括如下步骤:
步骤1、收集大脑时空原始数据,并进行分析、计算,得到每个样本中所有基因标准化表达数据集;所采集的大脑原始数据来源分为三种;一种是从NCBI高通量二代测序数据库SRA下载原始数据,一种是在GEO数据库中采集现有的标准化表达数据,并对收集到的数据集相应的GEO accession进行检索下载;一种是采集现有公开的人类大脑基因表达研究数据库中下载相应的标准化表达数据;
步骤2、构建由脑区和发育阶段组成的二维时空框架,将所有基因标准化表达数据按脑区和发育阶段信息对应于所构建的时空框架中,形成基因在行,脑区和发育阶段在列的表达矩阵,得到各基因数据范围内的单基因时空表达模式;其中单基因时空表达模式的分析方法如下;
步骤2.1,综合所有基因标准化表达数据,按脑区和发育阶段的信息构建二维时空框架,将步骤1中所得到的原数据集所划分精细的脑区信息和发育阶段与所构建的时空框架进行一一对应;
步骤2.2,先将所有样本按照脑区划分,所有数据集中按照二维时空框架将相同脑区或亚区的样本取算术平均值,再将每个脑区中的样本按照发育阶段进行划分,合并相同样本的表达量取算术平均值;
步骤2.3,将所有数据集标准化表达数据矩阵中的基因基于Ensembl数据库注释得到的基因标识转换成人类基因命名委员会发布的标准基因名称,并对相同基因的表达数据取算术平均值;
步骤2.4,删除基因表达数据在二维时空框架中都为0的基因,得到基因在行,脑区和发育阶段在列的表达矩阵,通过绘制热图,得到单基因时空表达模式;
步骤3、采用基因共表达网络分析方法对步骤2中所得到的单基因时空表达矩阵数据进行分析,得到多个基因模块,通过对每个基因模块取平均基因表达量,得到基因模块时空表达模式;基因共表达网络分析方法是:
步骤3.1,对每套数据二维时空框架下的单基因时空表达矩阵数据进行加权基因共表达网络分析,在基于R软件的加权基因共表达网络分析程序包中使用程序包中的blockwiseModules函数获取共表达基因模块,获取过程中调节mergeCutHeight和minModuleSize参数控制基因模块内基因数目在30-5000,并设置exportNetworkToCytoscape参数导出基因模块内的节点基因,基因相关的边信息以及它们的相关性系数;
步骤3.2,基因模块内所有基因取算术平均值表达量表示整个基因模块的基因表达水平,获得基因模块在二维时空框架下的时空表达模式;
步骤3.3,根据步骤3.1和步骤3.2,每套数据可以得到若干个基因模块、基因模块内基因与基因的相互关系以及每个基因模块的平均基因表达量,通过绘制热图,将基因模块时空表达模式可视化;
步骤4、对正常人类神经细胞表达数据进行分析,得到各神经细胞的特征性基因,将神经细胞的特征性基因与步骤3所得到的基因模块进行富集分析,得到与基因模块富集的细胞类型,获得基因模块的细胞表达模式。
2.根据权利要求1所述的人类大脑基因表达时空常模的建立方法,其特征在于,所述步骤1中对于从原始数据进行分析、计算得到基因标准化表达数据的具体步骤如下:
步骤1.1,从美国国立生物技术信息中心的高通量测序数据库SRA中下载原始SRA文件,并将SRA文件转换为fastq测序文件;
步骤1.2,对所得到的fastq测序文件进行质量评估分析,判断fastq测序文件中的数据质量各项指标是否合格,若存在不合格的数据,则删除对应的样本;
步骤1.3,通过数据处理去除fastq测序文件中序列两端的接头和低质量的序列;
步骤1.4,将所得fastq测序文件的序列比对到参考基因组,得到sam文件,其中使用Gencode数据库中人类基因组GRCh37 v27版本作为基因组注释文件;
步骤1.5,将sam文件转为bam文件,并按照染色体顺序进行排序;
步骤1.6,对所得到的 bam文件进行基因表达量计算,得到每个样本中所有基因标准化表达数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院心理研究所,未经中国科学院心理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910664819.0/1.html,转载请声明来源钻瓜专利网。