[发明专利]基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法有效
申请号: | 201910315741.1 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110097922B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 吕红强;刘聪毅;韩九强 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B25/00;G16B40/00;G16B45/00;G06F17/15;G06F17/16;G06N20/00 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 在线 机器 学习 hi 接触 矩阵 层级 tads 差异 分析 方法 | ||
一种基于在线机器学习的Hi‑C接触矩阵中层级式TADs差异分析方法,对Hi‑C数据进行标准化处理以消除实验系统偏差并增强数据间可比性;对标准化后的数据计算每个bin上下游区域之间的交互频数平均值,记为binSignal(i);对序列binSignal拟合并进行秩和检验,得到TADs的边界区域点;根据边界区域点得到所有可能层级式TADs,提出Hi‑C接触矩阵中交互频数和所有可能层级式TADs之间的数学模型;确立模型的目标函数,并首次采用在线机器学习算法FTRL进行层级式TADs差异分析模型的求解,识别出不同细胞系具有差异性的层级式TADs。本发明提出了Hi‑C接触矩阵中交互频数和层级式TADs之间的数学模型,并采用在线机器学习算法FTRL求得所有层级式TADs的权重系数,识别出不同细胞系之间有差异性的TADs。
技术领域
本发明属于生物技术领域,涉及不同细胞系下层级式TADs差异性分析,特别涉及一种基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法。
背景技术
Hi-C技术是一种高通量染色质构象捕获技术,通过Hi-C实验可以获得全基因组任意位点之间的相互作用信息。Hi-C数据为通过Hi-C实验获得的数据,Hi-C数据一般形式是一个矩阵,该矩阵被称为接触矩阵,接触矩阵是一个对称的方阵,接触矩阵中每个元素被称为交互频数。随着Hi-C技术的发展,科学家在对Hi-C数据研究时发现每个染色体大体可以分为染色体状态活跃和消极的两个区室(A/B compartment),其中A区室染色体状态活跃,B区室染色体状态消极,基于两种类别区室的发现,在更高的分辨率下,科学家又发现区室内存在相互作用强度较高的基因组区域,把它称为拓扑关联结构域(topologicalassociated domains,TADs),拓扑关联结构域内位点相互作用的强度远远高于外部的相互作用强度。
大量生物实验表明,TADs是调控基因转录表达的基本作用元件,在基因调控过程中,TADs约束了增强子和启动子的调控作用,除此之外,TADs边界的破坏也可能会导致一些疾病的发生,例如癌症。研究表明,大多数的TADs具有层级式结构,只有极少数的TADs是独立的。通过对层级式TADs进行差异性分析,可以深入了解基因表达影响细胞分化的机制。
现有技术分析TADs差异性的方法在考虑TADs的层级式结构方面有所欠缺,会影响差异性TADs的识别率。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法,针对不同细胞系下的Hi-C数据,进行层级式TADs差异分析。
为了实现上述目的,本发明采用的技术方案是:
一种基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法,其特征在于,包括如下步骤:
步骤1、对Hi-C数据进行标准化处理以消除Hi-C实验的系统偏差并且增强数据之间的可比性;
步骤2、对经过标准化之后的Hi-C数据计算每个bin上游和下游区域之间的交互频数的平均值,记为binSignal(i);
步骤3、利用曲线拟合算法对序列binSignal进行拟合,将拟合曲线的局部最小点初步视为TADs的边界区域点;
步骤4、通过秩和检验的方法,对假阳性的TADs边界区域点进行滤除,获得最终的TADs的边界区域点;
步骤5、根据TADs的边界区域点得到所有可能的层级式TADs,提出Hi-C接触矩阵M中交互频数Mij和所有可能层级式TADs之间的数学模型;
步骤6、确立模型的目标函数,利用在线机器学习算法FTRL对目标函数进行求解;
步骤7、基于求解的结果,识别出不同细胞系具有差异性的层级式TADs。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910315741.1/2.html,转载请声明来源钻瓜专利网。