[发明专利]一种发现并整合直肠癌相关基因及其功能分析的系统有效
申请号: | 201710037973.6 | 申请日: | 2017-01-19 |
公开(公告)号: | CN107066835B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 陈瑞;高娜;李晓波;孟庆涛;吴申申 | 申请(专利权)人: | 东南大学 |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B40/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈国强 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发现 整合 直肠癌 相关 基因 及其 功能分析 系统 | ||
1.一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的系统,其特征在于:该系统包括:
样本数据下载和整理模块,用于获取基因表达数据,包含疾病样本和对应的正常样本;
基因表达数据去极值并分析模块,用于对基因表达数据进行表达分析,统计差异显著性,此过程需排除零值极值影响;
筛选差异基因模块,用于将差异表达的mRNA按照差异倍数绝对值和校正的
功能分析模块,用于根据选中的mRNA,采用DAVID数据库信息进行基因本体分析,代谢通路分析和疾病相关分析;
互作基因注释模块,用于整合基于文献验证或是算法预测的网络现有的蛋白互作数据库找出预测或验证的互作基因并图形化展示;
该系统通过以下步骤实现发现并整合直肠癌相关基因及其功能分析:
步骤1,样本数据下载和整理:获取基因表达数据,选定目标疾病直肠癌和测序平台,下载数据,下载的数据包含疾病样本和对应的正常样本;具体包括如下步骤:
步骤1.1,进入R语言工作界面,载入TCGAbiolinks包;
步骤1.2,设定目标疾病、测序平台和mRNA文件类型;
步骤1.3,批量下载所需的标准化数据,得到单个样本数据;
步骤1.4,将上述步骤得到的单个样本数据进行合并;
步骤2,对步骤1得到的基因表达数据去极值并分析;其中,所述基因表达数据去极值并分析的步骤中的极值数据为:作为RNA表达值的标准化测序片段数目为零的数据;
步骤3,对经过步骤2处理后的基因表达数据进行筛选差异表达分析基因;其中,筛选差异表达分析基因选取1.5倍或者2倍的差异倍数,选用三个标准Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正
步骤4,对步骤3得到的基因进行功能分析并找出与疾病相关的条目;其中,基因进行功能分析基于DAVID数据库信息,包括基因本体分析,代谢通路分析,疾病相关分析和调控网络的构建;
所述基因本体分析的步骤采用DAVID数据库信息从生物过程、分子功能和细胞组分三个成分进行注释和富集分析;
所述代谢通路分析的步骤采用DAVID数据库信息包含的KEGG、Reactome数据库信息进行分析;
所述疾病相关分析的步骤采用DAVID数据库信息包含的GAD_DISEASE、GAD_DISEASE_CLASS和OMIM_DISEASE数据库信息进行分析;
步骤5,互作基因分析,构建网络示意图;其中,所述互作基因分析的步骤整合基于文献验证或是算法预测的网络蛋白互作数据库STRING、DIP、HPRD、IntAct和MINT,构建数据量最大最全的预测及验证信息相结合的蛋白互作数据集,得到能够相互作用的基因对,其分析结果能够图形化展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710037973.6/1.html,转载请声明来源钻瓜专利网。