[发明专利]一种心血管疾病患者DNA甲基化数据处理平台及方法在审
申请号: | 202110122466.9 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112802545A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 王理;赵红颖;许昊天 | 申请(专利权)人: | 哈尔滨医科大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B20/20 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 邢文月 |
地址: | 150081 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 心血管疾病 患者 dna 甲基化 数据处理 平台 方法 | ||
1.一种心血管疾病患者DNA甲基化数据处理平台,其特征在于,
包括搜索模块、浏览模块、疾病详情模块、工具模块;
所述搜索模块中包含一个带有快速搜索功能的主页HomePage,模糊搜索输入的疾病、基因、药物名称,跳转到结果展示页面;同时包含一个高级搜索页Search,入口位于导航栏,提供可指定疾病类型、甲基化状态、差异p值以获取相关差异甲基化基因的功能,并在结果展示界面展示;结果展示页面包含疾病、基因、甲基化状态、甲基化水平、显著p值信息的匹配搜索的条目,详情按钮会指向基因详情页面;
所述浏览模块包含目录页Curation、CVDrug Network页面与甲基化浏览器HMBrowser,入口均位于导航栏中,其中包含收录的全部心血管疾病与显著差异甲基化基因,点击后台分别跳转到疾病详情页与基因详情页;CVDrug Network页面以网络形式展现心血管疾病—甲基化基因—治疗药物三者间的关系,网络可交互,悬浮显示信息、点击高亮邻居节点;HM甲基化浏览器中用户通过提交 GeneSymbol,Gene ID 或基因组区域来浏览 DNA 和重注释后的探针的结构,并提供了到 UCSC 基因组浏览器的链接,供用户进一步研究心血管疾病中甲基化的特征;
所述疾病详情模块包含疾病详情页面与基因详情页面,入口在结果展示页面中,疾病详情页面展示了包括但不仅限于疾病的名称、别名、MeSH ID、DO ID、OMIM ID、甲基化状态信息、差异甲基化基因、差异甲基化基因功能注释、相关药物,并跳转到 HM 甲基化浏览器中;基因详情页面展示了包括但不限于基因的 Gene Name、基因组位置信息、以其为靶点的心血管病相关药物、各疾病中甲基化水平的对比图、外部网站功能注释链接,同时跳转到HM 甲基化浏览器中;
所述工具模块Tools入口位于导航栏,包括两种在线工具, 450K 探针重新注释工具与450K 文件转换工具;通过 450KPR,用户直观地浏览从 GEO 数据库中获取的平台注释文件;使用 450KPR,用户通过上传用户提供的外部 HM450k 阵列数据集来获得该样本的基因甲基化 beta 值的计算结果。
2.一种心血管疾病患者DNA甲基化数据处理方法,其特征在于,包括以下步骤:
步骤1、疾病名称获取:基于NCBI MeSH数据库、DO数据库、OMIM数据库收集心血管疾病的分类与别名、同义词;
步骤2、数据下载:在GEO数据库中以不同的关键词组合进行筛选,收集所有可能的与心血管疾病甲基化相关的数据集,并进行人工审查,从筛选结果中下载相关的甲基化数据以及注释信息;
步骤3、去除批次效应:批次效应表示样品在不同批次中处理和测量产生的与试验期间记录的任何生物变异无关的技术差异,应用R语言sva包里的函数ComBat来处理所下载数据间的批次效应问题;
步骤4、beta值获取:利用R语言minfi包,计算得出了HM450k芯片的beta值;
步骤5、芯片注释:为了将芯片数据注释到基因上,我们利用GEO平台文件构建了一个在线注释工具,并获得了每个基因的甲基化水平;
步骤6、基因注释:为方便从外部资源访问信息,将GeneCards,HGNC,Ensembl,NCBIGenBank,GREAT,OMIM和COSMIC数据库整合到基因的详情页面,这允许从外部资源有效地检索大量注释和功能信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨医科大学,未经哈尔滨医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110122466.9/1.html,转载请声明来源钻瓜专利网。