[发明专利]一种面向大规模基因调控网络的智能推断方法在审

专利信息
申请号: 202110762918.X 申请日: 2021-07-06
公开(公告)号: CN113506593A 公开(公告)日: 2021-10-15
发明(设计)人: 马宝山;吴一铭;宓东;宁乔;张萌 申请(专利权)人: 大连海事大学
主分类号: G16B20/20 分类号: G16B20/20
代理公司: 大连至诚专利代理事务所(特殊普通合伙) 21242 代理人: 杨威;邓珂
地址: 116000 辽宁省*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 大规模 基因 调控 网络 智能 推断 方法
【说明书】:

发明公开了一种面向大规模基因调控网络的智能推断方法,其包括在基因表达数据点分布的两维空间中,使用网格划分数据空间,使落在格子中的数据点的频率作为联合概率分布函数的估计,并确定基因x和基因y表达值之间的互信息;在不同大小的网格中计算互信息获得最大互信息系数,并得到靶基因的关键调控基因集;利用关键调控基因重要性融合算法计算调控基因对靶基因的重要性,得到重要性矩阵;在重要性矩阵中保留控制强度超过设定阈值的调控关系,控制强度超过设定阈值的调控关系构成基因调控网络。本方法针对大规模基因调控网络中关键调控基因的稀疏性,排除冗余基因表达信息,有效提高了计算效率,可以提高推断调控关系的准确度。

技术领域

本发明涉及基因调控领域,尤其涉及一种面向大规模基因调控网络的智能推断方法。

背景技术

基因调控网络是由基因之间相互作用形成的动态生化网络,能够从系统的角度认识、理解生物遗传信号的传输、细胞的分裂等活动规律,对于阐明细胞周期、损伤修复和凋亡的生物学机制至关重要。此外,基因调控网可以分析和识别病变细胞的关键调控基因,有助于肿瘤等复杂疾病的诊断、治疗以及靶向药物的研发。因此,推断基因调控网络是系统生物学的一项重要研究内容。随着高通量测序技术的发展,研究人员已经获得了大量的生物基因表达数据,例如大肠杆菌数据集包含的基因数量接近4000个,为基因调控网络的推断奠定了基础。近年来使用人工智能方法和基因表达数据推断基因调控网络成为生物信息学研究的热点。

目前已有的面向大规模基因表达数据的基因调控网络推断算法,主要存在两个缺点,一是推断算法的计算效率较低,二是推断算法的准确性有待提高。主要原因是基因调控网络具有高维度、非线性等特点,使得大规模基因调控网络的推断非常困难。

发明内容

本发明提供一种名称,以克服计算效率较低、准确性不高等技术问题。

为了实现上述目的,本发明的技术方案是:

一种面向大规模基因调控网络的智能推断方法,其特征在于,包括:

步骤1,在基因表达数据点分布的两维空间中,使用m*n的网格划分数据空间,使落在第(x,y)格子中的数据点的频率作为联合概率分布函数p(x,y)的估计值o(x,y);

步骤2,利用联合概率分布函数p(x,y)的估计值o(x,y)确定基因x和基因y表达值之间的互信息I(X;Y);

步骤3,在不同网格中利用互信息I(X;Y)计算最大互信息系数MIC(X;Y),筛选出调控基因集X中关于靶基因Y的关键调控基因集R;

步骤4,利用关键调控基因重要性融合算法计算关键调控基因集R中的调控基因对靶基因的重要性,获得重要性矩阵I;

步骤5,在重要性矩阵I中保留控制强度超过设定阈值的调控关系,控制强度超过设定阈值的调控关系构成基因调控网络。

进一步的,步骤4具体为:

步骤4.1,整合基因真实表达数据中的时间序列数据和平稳状态数据及关键调控基因集R,获得用于建模的基因表达数据集;

步骤4.2,将基因表达数据集分解为P个子集,每一个子集均有一个靶基因;

步骤4.3,在每个子集中,分别运用XGBoost、LightGBM和CatBoost算法建立树模型学习非线性函数,计算得到关键调控基因对靶基因的重要性值;

步骤4.4,将关键调控基因对靶基因的重要性值排序,得到一个有序的关键调控基因的重要性列表F1

步骤4.5,重复4.3和4.4,依据基因编号将P个重要性列表合成为重要性矩阵I。

进一步的,步骤3筛选出调控基因集X中关于靶基因Y的关键调控基因集R具体为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110762918.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top