[发明专利]一种发现并整合直肠癌相关基因及其功能分析的系统有效

专利信息
申请号: 201710037973.6 申请日: 2017-01-19
公开(公告)号: CN107066835B 公开(公告)日: 2020-03-17
发明(设计)人: 陈瑞;高娜;李晓波;孟庆涛;吴申申 申请(专利权)人: 东南大学
主分类号: G16B50/30 分类号: G16B50/30;G16B40/00
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈国强
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发现 整合 直肠癌 相关 基因 及其 功能分析 系统
【权利要求书】:

1.一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的系统,其特征在于:该系统包括:

样本数据下载和整理模块,用于获取基因表达数据,包含疾病样本和对应的正常样本;

基因表达数据去极值并分析模块,用于对基因表达数据进行表达分析,统计差异显著性,此过程需排除零值极值影响;

筛选差异基因模块,用于将差异表达的mRNA按照差异倍数绝对值和校正的P-value作为筛选条件,挑选出待研究mRNA;

功能分析模块,用于根据选中的mRNA,采用DAVID数据库信息进行基因本体分析,代谢通路分析和疾病相关分析;

互作基因注释模块,用于整合基于文献验证或是算法预测的网络现有的蛋白互作数据库找出预测或验证的互作基因并图形化展示;

该系统通过以下步骤实现发现并整合直肠癌相关基因及其功能分析:

步骤1,样本数据下载和整理:获取基因表达数据,选定目标疾病直肠癌和测序平台,下载数据,下载的数据包含疾病样本和对应的正常样本;具体包括如下步骤:

步骤1.1,进入R语言工作界面,载入TCGAbiolinks包;

步骤1.2,设定目标疾病、测序平台和mRNA文件类型;

步骤1.3,批量下载所需的标准化数据,得到单个样本数据;

步骤1.4,将上述步骤得到的单个样本数据进行合并;

步骤2,对步骤1得到的基因表达数据去极值并分析;其中,所述基因表达数据去极值并分析的步骤中的极值数据为:作为RNA表达值的标准化测序片段数目为零的数据;

步骤3,对经过步骤2处理后的基因表达数据进行筛选差异表达分析基因;其中,筛选差异表达分析基因选取1.5倍或者2倍的差异倍数,选用三个标准Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正P-value得到差异表达的mRNA;

步骤4,对步骤3得到的基因进行功能分析并找出与疾病相关的条目;其中,基因进行功能分析基于DAVID数据库信息,包括基因本体分析,代谢通路分析,疾病相关分析和调控网络的构建;

所述基因本体分析的步骤采用DAVID数据库信息从生物过程、分子功能和细胞组分三个成分进行注释和富集分析;

所述代谢通路分析的步骤采用DAVID数据库信息包含的KEGG、Reactome数据库信息进行分析;

所述疾病相关分析的步骤采用DAVID数据库信息包含的GAD_DISEASE、GAD_DISEASE_CLASS和OMIM_DISEASE数据库信息进行分析;

步骤5,互作基因分析,构建网络示意图;其中,所述互作基因分析的步骤整合基于文献验证或是算法预测的网络蛋白互作数据库STRING、DIP、HPRD、IntAct和MINT,构建数据量最大最全的预测及验证信息相结合的蛋白互作数据集,得到能够相互作用的基因对,其分析结果能够图形化展示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710037973.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top