[发明专利]基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法有效
申请号: | 201910315741.1 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110097922B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 吕红强;刘聪毅;韩九强 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B25/00;G16B40/00;G16B45/00;G06F17/15;G06F17/16;G06N20/00 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于在线机器学习的Hi‑C接触矩阵中层级式TADs差异分析方法,对Hi‑C数据进行标准化处理以消除实验系统偏差并增强数据间可比性;对标准化后的数据计算每个bin上下游区域之间的交互频数平均值,记为binSignal(i);对序列binSignal拟合并进行秩和检验,得到TADs的边界区域点;根据边界区域点得到所有可能层级式TADs,提出Hi‑C接触矩阵中交互频数和所有可能层级式TADs之间的数学模型;确立模型的目标函数,并首次采用在线机器学习算法FTRL进行层级式TADs差异分析模型的求解,识别出不同细胞系具有差异性的层级式TADs。本发明提出了Hi‑C接触矩阵中交互频数和层级式TADs之间的数学模型,并采用在线机器学习算法FTRL求得所有层级式TADs的权重系数,识别出不同细胞系之间有差异性的TADs。 | ||
搜索关键词: | 基于 在线 机器 学习 hi 接触 矩阵 层级 tads 差异 分析 方法 | ||
【主权项】:
1.一种基于在线机器学习的Hi‑C接触矩阵中层级式TADs差异分析方法,其特征在于,包括如下步骤:步骤1、对Hi‑C数据进行标准化处理以消除Hi‑C实验的系统偏差并且增强数据之间的可比性;步骤2、对经过标准化之后的Hi‑C数据计算每个bin上游和下游区域之间的交互频数的平均值,记为binSignal(i);步骤3、利用曲线拟合算法对序列binSignal进行拟合,将拟合曲线的局部最小点初步视为TADs的边界区域点;步骤4、通过秩和检验的方法,对假阳性的TADs边界区域点进行滤除,获得最终的TADs的边界区域点;步骤5、根据TADs的边界区域点得到所有可能的层级式TADs,建立Hi‑C接触矩阵M中交互频数Mij和所有可能层级式TADs之间的数学模型;步骤6、确立模型的目标函数,利用在线机器学习算法FTRL对目标函数进行求解;步骤7、基于求解的结果,识别出不同细胞系具有差异性的层级式TADs。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910315741.1/,转载请声明来源钻瓜专利网。