[发明专利]联合归一化和差异检测方法在审
申请号: | 201910687058.0 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110428869A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 汤斌华;王宇琦 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 归一化 差异检测 数据集 高通量 预处理 差异比较 染色质 可视化处理 联合 可视化 染色体 填补 分析 | ||
本发明公开了一种联合归一化和差异检测方法,基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理;基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化;基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。优点:本发明开创性提出了差异比较预处理和可视化处理,填补了目前对于多个数据集的归一化和差异检测方法的空白;能够实现多个高通量染色体相互作用数据集的高效准确归一化和差异检测;另外该技术方法相对高效且快速,且可视化程度高。
技术领域
本发明涉及一种联合归一化和差异检测方法,属于生物信息学技术领域。
背景技术
基因组的3D染色体结构中染色质相互作用频率IF(Interaction Frequency) 是一组具有重要意义的数据。它不仅决定了细胞类型和特异性基因表达,也决定了癌症中肿瘤基因和肿瘤抑制因子的错误调节。因此研究染色质相互作用是理解基因组调控不可或缺的重要一步。现代生物学的发展使传统的染色质构象捕获(3C)技术演变为Hi-C测序技术,这使我们可以检测整个基因组中的长距离染色质相互作用,也使我们对染色质相互作用的影响因素有了更明确的认识,主要分为技术特异性偏差和DNA序列造成的偏差。这些偏差的存在使我们在进一步对整个数据集进行研究对比之前,必须对数据集进行归一化。目前的生物学信息领域中,对于数据集的归一化方法主要集中在对单一数据集的归一化,缺少对于多个数据集的高效的归一化方法。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种联合归一化和差异检测方法。
为解决上述技术问题,本发明提供一种联合归一化和差异检测方法,基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理;基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化;基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。
进一步的,所述差异比较预处理和可视化处理,具体为:
利用高通量染色质相互作用数据集建立可供比较的数据集;基于可供比较的数据集建立单位距离D和染色质相互作用频率差M的连接,构建差异比较数据表;基于单位距离D和染色质相互作用频率差M的连接,将待比较的数据集以散点的形式进行可视化,创建横轴为M,纵轴为D的散点图,即MD图。为了
进一步的,所述利用高通量染色质相互作用数据集建立可供比较的数据集,具体为:利用GEO数据库中公开的高通量染色质相互作用数据集建立可供比较的BEDPE格式的数据集。
进一步的,所述联合归一化,具体为:
对完成差异比较预处理的数据集进行非参数化方法构建回归模型;基于所述回归模型对数据集进行归一化,对在制备数据时使用不同的切割酶所带来的生物技术偏差进行消除。
进一步的,所述构建回归模型采用loess局部加权线性回归的方法对完成差异比较预处理的数据集进行非参数化方法构建。
进一步的,所述差异检测与分析,具体为:
在联合归一化后的数据集中引入受控变化值,根据TPR、FPR和MCC指标对平均相互作用值设置阈值;通过Z分数模型,得到数据集样本的显著性水平p 值,确定差异样本;结合所述可视化处理,根据p值对数据散点进行染色处理,进一步对差异检测结果进行可视化表达。
进一步的,还包括:基于差异检测与分析得到的相关结论,结合模拟Hi-C 数据的方法,对得到的相关结论进行进一步的评价与鉴定。
进一步的,所述相关结论为:
(1)通过预处理和联合归一化处理的Hi-C数据集,能够消除原始数据集中由于全局统计学范畴所带来的局部偏差以及在制备数据时用不同的切割酶所带来的实验室偏差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910687058.0/2.html,转载请声明来源钻瓜专利网。