[发明专利]DMR集合识别结果评估方法、评估系统及选择方法在审
申请号: | 202210245595.1 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114400050A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 彭小清;崔万新;孔祥艳;胡德华;盛羽 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B40/30 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dmr 集合 识别 结果 评估 方法 系统 选择 | ||
本发明公开了一种DMR集合识别结果评估方法,包括对于每个预测的差异甲基化区域以区域内探针CpG位点为中心对CpG位点进行聚类;计算每个探针在实验组和对照组甲基化芯片数据上的平均甲基化水平差值;计算每个探针CpG位点与对应类中其他CpG位点的相关系数;计算每个差异甲基化区域在实验组和对照组甲基化芯片数据上的甲基化水平差异;计算每个待评估方法的评估指标完成DMR集合识别结果的评估。本发明还公开了一种实现所述DMR集合识别结果评估方法的评估系统,以及包括了所述DMR集合识别结果评估方法的选择方法。本发明无需匹配额外生物数据,能够为选择更优异的差异甲基化区域集合提供指导,客观性高、可靠性高且科学合理。
技术领域
本发明属于计算机技术领域,具体涉及一种DMR集合识别结果评估方法、评估系统及选择方法。
背景技术
近年来,为了研究在疾病的发生和发展中疾病特异性的甲基化改变,以及在不同组织中组织特异性甲基化现象,已经产生了大量的450K甲基化芯片数据。为了分析疾病组织和正常组织之间的差异甲基化区域(DMR)以及不同组织之间的DMR,研究者们开发了许多种DMR识别的方法,并用于甲基化芯片数据的分析。根据识别过程,这些方法可以分为基于差异甲基化位点合并的方法和基于区域差异显著性计算的方法。其中,区域的类型可分为预定义区间类型和自定义区间类型:预定义区间类型通常包括基因组上的功能性区域,例如启动子区域、CpG(Cytosine-phosphoric acid-Guanine,胞嘧啶-磷酸-鸟嘌呤)岛、转录起始位点前2000bp区域等,这些区域通常富集CpG位点划分区间;自定义区域则主要根据甲基化芯片数据上探针CpG位点对应的基因组坐标距离,将距离小于给定阈值的探针CpG位点划分成一个区间。
然而,不同的方法在DMR识别过程的各个步骤都有不同的策略,而且这些步骤都对最后识别的DMR集合以及DMR的甲基化差异有重要影响。面对众多的DMR识别方法,如何选择更有效的方法用于识别DMR,或者从多个方法的识别结果中选择更好的DMR集合并用于下游研究,对于医学家和生物学家等研究人员而言,就显得尤为重要。
由于缺乏标准的DMR集合,因此研究人员现在基本都采用模拟数据来评估识别的DMR的准确性。然而,生成模拟数据的假设过程也会引入算法设计者的偏好性,因此并不能客观的反应真实数据;同时,其他生物数据的富集性分析,例如组蛋白、转录因子绑定位点的chip-seq数据、基因表达数据、基因组区域注释信息等,虽然也能用于佐证所预测的DMR集合的生物意义,但是面对不同组织的甲基化芯片数据分析时,需要匹配chip-seq数据、基因表达数据等数据;这些需要匹配的数据为不同研究和分析带来了很大的困难。
发明内容
本发明的目的之一在于提供一种客观性高、可靠性高且科学合理的DMR集合识别结果评估方法。
本发明的目的之二在于提供一种实现所述DMR集合识别结果评估方法的评估系统。
本发明的目的之三在于提供一种包括了所述DMR集合识别结果评估方法的选择方法。
本发明提供的这种DMR集合识别结果评估方法,包括如下步骤:
S1. 对于每个预测的差异甲基化区域,以区域内探针CpG位点为中心,对区域内所有的CpG位点进行聚类;
S2. 计算每个探针在实验组甲基化芯片数据上和对照组甲基化芯片数据上的平均甲基化水平差值;
S3. 基于公共数据库中其他组织的甲基化测序数据,计算每个探针CpG位点与对应类中其他CpG位点的相关系数;
S4. 基于步骤S2得到的平均甲基化水平差值和步骤S3得到的相关系数,计算每个差异甲基化区域在实验组甲基化芯片数据上和对照组甲基化芯片数据上的甲基化水平差异;
S5. 对于每个待评估方法所预测的差异甲基化区域集合,计算每个待评估方法的评估指标,完成DMR集合识别结果的评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210245595.1/2.html,转载请声明来源钻瓜专利网。