[发明专利]基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法有效

专利信息
申请号: 201910315741.1 申请日: 2019-04-19
公开(公告)号: CN110097922B 公开(公告)日: 2020-12-08
发明(设计)人: 吕红强;刘聪毅;韩九强 申请(专利权)人: 西安交通大学
主分类号: G16B20/00 分类号: G16B20/00;G16B25/00;G16B40/00;G16B45/00;G06F17/15;G06F17/16;G06N20/00
代理公司: 西安智大知识产权代理事务所 61215 代理人: 段俊涛
地址: 710049 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于在线机器学习的Hi‑C接触矩阵中层级式TADs差异分析方法,对Hi‑C数据进行标准化处理以消除实验系统偏差并增强数据间可比性;对标准化后的数据计算每个bin上下游区域之间的交互频数平均值,记为binSignal(i);对序列binSignal拟合并进行秩和检验,得到TADs的边界区域点;根据边界区域点得到所有可能层级式TADs,提出Hi‑C接触矩阵中交互频数和所有可能层级式TADs之间的数学模型;确立模型的目标函数,并首次采用在线机器学习算法FTRL进行层级式TADs差异分析模型的求解,识别出不同细胞系具有差异性的层级式TADs。本发明提出了Hi‑C接触矩阵中交互频数和层级式TADs之间的数学模型,并采用在线机器学习算法FTRL求得所有层级式TADs的权重系数,识别出不同细胞系之间有差异性的TADs。
搜索关键词: 基于 在线 机器 学习 hi 接触 矩阵 层级 tads 差异 分析 方法
【主权项】:
1.一种基于在线机器学习的Hi‑C接触矩阵中层级式TADs差异分析方法,其特征在于,包括如下步骤:步骤1、对Hi‑C数据进行标准化处理以消除Hi‑C实验的系统偏差并且增强数据之间的可比性;步骤2、对经过标准化之后的Hi‑C数据计算每个bin上游和下游区域之间的交互频数的平均值,记为binSignal(i);步骤3、利用曲线拟合算法对序列binSignal进行拟合,将拟合曲线的局部最小点初步视为TADs的边界区域点;步骤4、通过秩和检验的方法,对假阳性的TADs边界区域点进行滤除,获得最终的TADs的边界区域点;步骤5、根据TADs的边界区域点得到所有可能的层级式TADs,建立Hi‑C接触矩阵M中交互频数Mij和所有可能层级式TADs之间的数学模型;步骤6、确立模型的目标函数,利用在线机器学习算法FTRL对目标函数进行求解;步骤7、基于求解的结果,识别出不同细胞系具有差异性的层级式TADs。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910315741.1/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top