[发明专利]一种基于质谱代谢组学的通路分析建模方法有效
申请号: | 202110277077.3 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113049664B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 邓伶莉;马磊;韩碧荣 | 申请(专利权)人: | 东华理工大学 |
主分类号: | G01N27/62 | 分类号: | G01N27/62;G01N30/72;G01N30/86;G16B40/00 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;王婷婷 |
地址: | 330000 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 代谢 通路 分析 建模 方法 | ||
1.一种质谱代谢组学的通路分析建模方法,其特征在于,包括如下步骤:
S1:采集正常生物和患病生物的生物样本,对采集样本得到的质谱转化成mzML文件,对质谱文件进行中心化、去噪以及对齐处理,得到样本的代谢物的二维数据矩阵;
S2:对样本的代谢物的二维数据矩阵以及样本类别矢量矩阵,做中心化和单位方差归一化处理;
S3:获取代谢物-通路映射关系,并通路权重系数进行优化;
S4:进行通路排序,调整惩罚因子并确定通路被选择的频率,利用通路的选择频率对通路进行排序;
所述步骤S3对代谢物-通路映射关系的通路权重系数进行优化,具体包括:
S31:初始化通路权重系数ωg:其中,表示的是该通路组内包括的代谢物的数目;
S32:初始化通路选择计数器cg:cg=0,g=1,2,…,G,通路选择的经验分布为:
S33:通路权重系数的调整:计算通路选择的经验分布Πω和零分布之间的距离:
若D(Πnull|∏ω)<∈,停止优化过程,其中∈≥0且∈表示收敛精度;
从g=1到g=G,循环
S34:循环迭代:转步骤S32;
所述步骤S4进行通路排序,调整惩罚因子并确定通路被选择的频率,利用通路的选择频率对通路进行排序,具体包括:
S41:确定惩罚因子λ值:
初始化:令λ=1.0,K=min(N,M),β>0且β表示学习率,S=φ且s表示所选通路集;
ogPLS建模:用ogPLS方法计算若则S={S,g};
调整惩罚因子λ:如果|S|≠L,L为所要选择的通路数量,则更新λ=λ+β·(|S|-L);回到ogPLS建模步骤继续ogPLS建模直至满足|S|=L;
S42:确定通路被选择的频率:
自助法建模,初始化通路选择计数器cg=0,g=1,2,…,G;从n=1到n=1000循环:对数据进行50%的随机采样构建一个ogPLS模型Mn;若通路被模型Mn选择,则cg=cg+1;
S43:利用通路的选择频率对通路进行排序:
利用通路选择的频率对通路进行排序Fλ=(c1,c2,…,cG)/T,通路被选择的频率越高,该通路的排序越靠前。
2.根据权利要求1所述的一种质谱代谢组学的通路分析建模方法,其特征在于,构建所述ogPLS模型的方法,具体包括:
S421:初始化通路特定基向量K=min(N,M),N为样本数量,M为N个样本中代谢物类别的数量;
S422:计算ogPLS模型的基向量uk:从k=1到K循环:
从g=1到G计算
其中
Z(g)表示组的收缩矩阵,是组中检测到的代谢物,i=1,2,…,M是在整个数据集中检测到的代谢物;
计算若||uk||2≠0,则计算:tk=Xuk,否则||uk||2=0,则K=k;
S423:建立回归模型:
其中X表示N个样本M个代谢物的二维数据矩阵,y表示原始响应,U=(u1,u2,…,uK)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110277077.3/1.html,转载请声明来源钻瓜专利网。