[发明专利]一种基于乳腺癌疾病的调控网络构建及分析方法有效
申请号: | 201810972336.2 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109243523B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 王之琼;曲璐渲;郭上慧;霍岳阳;高笑宇;钱唯 | 申请(专利权)人: | 东北大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B25/00 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 刘晓岚 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 乳腺癌 疾病 调控 网络 构建 分析 方法 | ||
本发明提出一种基于乳腺癌疾病的基因调控网络构建及分析方法,流程包括:乳腺癌相关基因初步筛选;基因调控网络的构建;根据基因调控网络结果,进行节点中心性分析,包括节点的度中心性,接近中心性,中介中心性和特征向量中心性;取网络节点的度中心性,接近中心性,中介中心性和特征向量中心性的前N个数据作为为筛选出的相关基因;在人类基因中有效地筛选出了乳腺癌相关基因,从而建立与乳腺癌疾病相关的基因调控网络,并通过节点中心性分析得到重要基因,可以促进从基因学的角度对乳腺癌疾病的研究,为找到干预乳腺癌疾病发生的有效途径奠定基础。
技术领域
本发明属于医学信息学领域,涉及一种基于乳腺癌疾病的基因调控网络构建及分析方法。
背景技术
遗传表达确定了细胞和组织的表型和发育状态。人类常见的疾病,如恶性肿瘤和神经退行性疾病都可以追溯到异常基因表达。通常,基因不是单独表达的,一个基因表达可以影响其他基因的表达,同时也受其他基因表达的影响。基因之间的相互作用和相互关联的调节关系形成了基因调控网络。基因调控网络的建模和分析为乳腺癌疾病提供了遗传视角的治疗和诊断。因此,构建与疾病相关的基因调控网络对探索人体机制和疾病治疗具有重要意义。
现在的网络建模方法有效地解决了基因调控网络构建的问题,但也存在一些缺点。例如,贝叶斯网络模型可以准确地建立监管网络,但仅适用于构建小规模网络。互信息可以支持大规模网络建模,但不能描述基因之间的调节关系。多模型组合可以改善上述两个问题,但仍不能有效满足基因组规模调节网络建模的需求。
发明内容
针对现有技术的不足,本发明的目的是提出基于乳腺癌疾病的基因调控网络构建及分析方法,利用基因对之间的互信息值进行逐轮筛选,在全基因组数据中筛选出与乳腺癌疾病相关的200个基因进行基因调控网络构建并进行网络分析,为乳腺癌疾病的研究人员提供有价值的参考。
本发明提出一种基于乳腺癌疾病的基因调控网络构建及分析方法,包括以下步骤:
步骤1:乳腺癌相关基因初步筛选:将乳腺癌基因分为基准基因、相关基因与筛选出的相关基因,基准基因指现有技术中已经认定与乳腺癌疾病有关系的基因,相关基因指除现有技术中以外的所有基因,筛选出的相关基因指用本申请的方法筛选出与乳腺癌疾病关系紧密的基因,包括步骤1.1~步骤1.4:
步骤1.1:将基因表达数据分为两个矩阵,X矩阵为乳腺癌基准基因的表达数据,Y矩阵是待筛选的其余乳腺癌相关基因的表达数据,在X矩阵与Y矩阵中,每一行为一个基因,每一列为一个样本;
步骤1.2:矩阵Y中的向量Yj依次与X中的向量Xi计算每个基因之间的互信息值,Yj和Xi代表第j个和第i个基因的数据;
步骤1.3:人工选择阈值Isn,若互信息值大于等于Isn,则向量Yj对应的基因添加到X矩阵中,并在矩阵Y中删除,阈值Isn为动态选择的,根据每一轮的互信息结果,对每轮的互信息的值大小进行排序,Isn即为当前轮中第sn个阈值,筛选出来互信息值最大的前sn个基因;
步骤1.4:重复步骤1.2至1.3,直到矩阵X中的基因数量达到预设定的值M个;
步骤2:基因调控网络的构建:利用步骤1中获得基因的表达数据矩阵X,通过BNFinder2工具进行调控网络构建,设置调控节点集合的数量,评分函数为BDE评分函数,得到一个概率网络,网络节点代表基因,有向边代表基因之间的调控关系;具体包括步骤2.1~步骤2.3:
步骤2.1:数据处理:根据X矩阵,确定基因个数及样本数量,并为每个基因设定潜在调控基因;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810972336.2/2.html,转载请声明来源钻瓜专利网。