[发明专利]一种基于结点关系对的复合功能模块识别方法及系统在审
申请号: | 201810502270.0 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108710783A | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 杨亦 | 申请(专利权)人: | 湖南女子学院 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 410004 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复合功能 结点 模块识别 功能子模块 调控关系 复合生物 复合网络 复杂疾病 理论意义 生物意义 预后分析 构建 诊断 预测 网络 | ||
1.一种基于结点关系对的复合功能模块识别方法,包括以下步骤:
1)构建复合网络
根据调控者miRNA和靶基因mRNA的表达谱数据和miRNA-mRNA靶点信息,运用多元线性回归模型预测miRNA-mRNA调控关系,得到miRNA-mRNA调控网络;
根据mRNA和mRNA之间的相互作用关系,得到mRNA-mRNA互作网络;
2)寻找初始功能子模块集合
在miRNA-mRNA调控网络中寻找最大二分团,从互作网络寻找与之相关的mRNA-mRNA互作边,尝试将所述mRNA-mRNA互作边加入到对应的最大二分团中,过滤掉不含R-pair结构的最大二分团;得到初始功能子模块集合;
3)加入mRNA结点、互作边和调控边
对初始功能子模块集合中的每一个初始功能子模块,从mRNA-mRNA互作网络中寻找与之相关的mRNA邻居结点、互作边,从miRNA-mRNA调控网络中寻找对应的调控边,将所述mRNA结点、互作边和调控边添加到对应的初始功能子模块中,得到中间功能子模块集合;
4)加入miRNA结点和调控边
对中间功能子模块集合中的每一个中间功能子模块,从miRNA-mRNA调控网络中寻找与之相关的miRNA和调控边,按第三规则将所述miRNA和调控边添加到对应的中间功能子模块中,得到最终功能子模块集合,以所述最终功能子模块集合作为识别的复合功能模块。
2.根据权利要求1所述的基于结点关系对的复合功能模块识别方法,其特征在于,所述步骤1)中,运用式(1)的多元线性回归模型Elastic Net预测miRNA-mRNA调控关系:
在公式(1)中,样本s∈{1,2...S},S为样本总数;yi,s(i∈{1,2...N})是第i个mRNA在第s个样本上的表达值,N为mRNA个数;uj,s(j∈{1,2...M})是第j个miRNA在第s个样本上表达值,M为miRNA个数;βi,0是一个初始值,ti,j是第j个miRNA在第i个mRNA的靶点信息,βi,j是拟合线性系数,它受限于式(2):
α取值范围为[0,1],采用十倍交叉法进行验证取值。
3.根据权利要求2所述的基于结点关系对的复合功能模块识别方法,其特征在于,所述步骤2)中,所述R-pair结构定义为:如果一对mRNA和同一个miRNA之间存在调控边,且这两个mRNA之间也存在互作边,定义这种三角形结构为R-pair结构。
4.根据权利要求3所述的基于结点关系对的复合功能模块识别方法,其特征在于,所述步骤3)中,加入mRNA结点、互作边和调控边需满足式(3):
R_density(mnew)+I_density(mnew)>R_density(m)+I_density(m) (3)
式(3)中,m为初始功能子模块,mnew为中间功能子模块;I_density(m)为初始功能子模块中mRNA-mRNA互作边的密度,R_density(m)为初始功能子模块中miRNA-mRNA调控边的密度;I_density(mnew)为中间功能子模块中mRNA-mRNA互作边的密度,R_density(mnew)为中间功能子模块中miRNA-mRNA调控边的密度;
I_density(m)需满足式(4):
式(4)中,M代表初始功能子模块中mRNA的数量,I(m)表示初始功能子模块中mRNA-mRNA交互边的数量;
R_density(m)需满足式(5):
式(5)中,N、M分别初始功能子模块中miRNA和mRNA的数量,R(m)表示初始功能子模块中miRNA-mRNA调控边的数量。
5.根据权利要求4所述的基于结点关系对的复合功能模块识别方法,其特征在于,所述步骤4)中,加入miRNA结点和调控边需满足以下条件:设最终功能子模块为mcnew,当最终功能子模块中miRNA-mRNA调控边的密度R_density(mcnew)小于阈值θ时,结束添加miRNA和调控边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南女子学院,未经湖南女子学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810502270.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用