[发明专利]一种特定癌症差异表达基因调控网络的构建方法有效

专利信息
申请号: 201610128387.8 申请日: 2016-03-07
公开(公告)号: CN105740651B 公开(公告)日: 2018-05-22
发明(设计)人: 刘桂霞;苏令涛;孟祥宇;马青山 申请(专利权)人: 吉林大学
主分类号: G06F19/20 分类号: G06F19/20
代理公司: 北京远大卓悦知识产权代理事务所(普通合伙) 11369 代理人: 史霞
地址: 130000 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 特定 癌症 差异 表达 基因 调控 网络 构建 方法
【权利要求书】:

1.一种特定癌症差异表达基因调控网络的构建方法,其特征在于,包括如下步骤:

步骤一、根据基因间的功能相似性权值,构建骨架基因互作网络;

步骤二、采用分割法,对骨架基因互作网络进行模块划分;

步骤三、使用全基因甲基化数据筛选差异表达基因;

步骤四、将筛选出来的差异表达基因按照功能进行归类;

步骤五、将所有映射到相同功能模块的差异表达基因作为一个功能分类;

步骤六、对每一个功能分类中的所有基因构建子调控网络;

步骤七、在骨架网络的指导下进行子调控网络拼装;

其中,步骤一中,两个基因Gi、Gj间权值W(Gi,Gj)表示为:

W ( G i , G j ) = 1 m Σ n = 1 m Sim n ( G i , G j ) ]]>

其中,m表示与基因相关信息的种类数,Simn(Gi,Gj)表示在某种信息注释下的相似值,表示为:

Sim n ( G i , G j ) = | N i ∩ N j | | N i ∪ N j | , ( n ∈ ( 1 , 2 , 3 , ... , m ) ) ]]>

其中,|Ni∩Nj|表示在某种注释信息下任意两基因间共同的该信息的个数,|Ni∪Nj|表示两基因所含有的注释信息总数;

步骤二中的分割法为:对骨架网络中所有边,按照权值大小进行排序,然后依次选择权值最小的边删除,在删除过程中对网络中的模块数量、模块的节点数、边数、模块聚类系数进行衡量,直到得到满足要求的模块划分为止;

步骤三中,采用T检验,得到t分布

t = x ‾ c a s e - x ‾ c o n t r o l s c a s e 2 / n 1 + s c o n t r o l 2 / n 2 ]]>

其中,表示某基因在所有患病样本下的平均甲基化值,表示该基因在说有对照组样本下甲基化的平均值,分别对应患病和正常甲基化的方差,其中n1和n2表示患病和正常样本的个数;

通过对每一个基因计算一个T统计量来衡量患病和正常情况下基因甲基化的差异,然后根据t分布计算显著性p值来衡量这种差异性,从而可以按照定义的阈值筛选出显著差异表达的基因;

步骤六中,使用如下公式进行所述子调控网络的构建

i f c o n ( g i , g j ) t h e n · ( ( P ( - 1 , - 1 ) + P ( 1 , 1 ) + P ( 0 , 0 ) ) - ( P ( - 1 , 1 ) + P ( 1 , - 1 ) + P ( 0 , 0 ) ) ) > 0 · ( ( P ( - 1 , - 1 ) + P ( 1 , 1 ) + P ( 0 , 0 ) ) - ( P ( - 1 , 0 ) + P ( 0 , - 1 ) + P ( 1 , 0 ) + P ( 0 , 1 ) + P ( 0 , 0 ) ) ) > θ ]]>

i f r e ( g i , g j ) t h e n · ( ( P ( - 1 , 1 ) + P ( 1 , - 1 ) + P ( 0 , 0 ) ) - ( P ( - 1 , - 1 ) + P ( 1 , 1 ) + P ( 0 , 0 ) ) ) > 0 · ( ( P ( - 1 , 1 ) + P ( 1 , - 1 ) + P ( 0 , 0 ) ) - ( P ( - 1 , 0 ) + P ( 0 , - 1 ) + P ( 1 , 0 ) + P ( 0 , 1 ) + P ( 0 , 0 ) ) ) > θ ]]>

其中,con(gi,gj)表示基因gi和基因gj间是正向调控关系,re(gi,gj)表示两基因间是反向调控关系,θ是位于0到1之间的阈值;P(vi,vj)其中vi和vj取值为-1,0,1,定义如下

其中,N表示基因表达数据样本数,D表示离散化基因表达数据矩阵,Dgi,h是该矩阵中的元素,gi和gj是任意两个基因;D的构建方式如下:

D i j = - 1 i f M i j < avg i - γ × sd i 0 i f avg i - γ × sd i ≤ i f M i j ≤ avg i + γ × sd i 1 i f M i j > avg i + γ × sd i ]]>

其中,γ是0到1之间的参数值,Mi,j是抽取的基因表达矩阵,avgi表示基因i在所有样本下表达值的平均值,sdi表示基因i在所有样本下表达值的方差。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610128387.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top