[发明专利]一种基于深度遗传信息特征的药物敏感性预测方法及装置有效
申请号: | 202010490247.1 | 申请日: | 2020-06-02 |
公开(公告)号: | CN111798030B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 王红强;时明 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G06N3/08;G06F18/214;G06N3/0464;G06T7/00 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 奚华保 |
地址: | 230000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 遗传信息 特征 药物 敏感性 预测 方法 装置 | ||
1.一种基于深度遗传信息特征的药物敏感性预测方法,其特征在于,该方法包括以下步骤:
(1)获取训练样本数据集,所述训练样本数据集由各个训练样本的基因遗传数据和抗肿瘤药物敏感性实际值构成;
(2)根据选取的生物分子网络构建基因遗传信号转导深度神经网络,所述基因遗传信号转导深度神经网络以样本的基因遗传数据为输入,以样本的深度遗传信息特征为输出;
(3)构建深度遗传信息特征编码器,所述深度遗传信息特征编码器以样本的深度遗传信息特征为输入,以样本的抗肿瘤药物敏感性预测值为输出;
(4)利用所述训练样本数据集对构建的基因遗传信号转导深度神经网络和深度遗传信息特征编码器进行训练;
(5)获取待测样本的基因遗传数据;
(6)将所述待测样本的基因遗传数据输入训练好的基因遗传信号转导深度神经网络,提取所述待测样本的深度遗传信息特征;
(7)将所述待测样本的深度遗传信息特征输入训练好的深度遗传信息特征编码器,获得所述待测样本的抗肿瘤药物敏感性预测值;
步骤(2)中,所述根据选取的生物分子网络构建基因遗传信号转导深度神经网络,具体包括:
(21)选取一个含有N个顶点的生物分子网络;
(22)利用切比雪夫多项式对所述生物分子网络进行快速谱滤波,构建第一个卷积层;
(23)对第一个卷积层进行图粗化处理,构建第一个池化层;
(24)依照步骤(22)的方法,在第一个池化层的基础上构建第二个卷积层;然后再依照步骤(23)的方法,在第二个卷积层的基础上构建第二个池化层;以此类推,以串联方式层叠多重{卷积层、池化层},直至最后一个池化层的顶点数Nend小于预设数值N0,构建完成基因遗传信号转导深度神经网络;
步骤(22)具体包括:
(221)将所述生物分子网络的网络结构作为第一个卷积层的网络结构G1;
(222)定义切比雪夫多项式:
Tk(x)=2xTk-1(x)-Tk-2(x)
其中,x表示实数变量,Tk(x)、Tk-1(x)、Tk-2(x)分别表示k阶、k-1阶、k-2阶切比雪夫不等式,且T0(x)=1,T1(x)=x;
(223)定义一个切比雪夫多项式形式的滤波器:
其中,gθ(Λ1)表示滤波器,θk,k=0,1,…,K0表示k阶切比雪夫不等式的系数,也是待优化参数,随机初始化,K0为默认参数,表示k阶切比雪夫不等式在处的值,为中间变量,Λ1表示G1的拉普拉斯矩阵的特征值矩阵,λmax表示G1的拉普拉斯矩阵的最大特征值,IN表示N阶单位矩阵;
(224)假设第一个卷积层的输入信号为f1,f1经过所述滤波器gθ(Λ1)处理后得到的信号为f2:
根据步骤(222)定义的切比雪夫多项式,令:
其中,ak,k=0,1,…,K0表示为方便计算而设置的中间变量;
利用所述切比雪夫多项式之间的迭代关系,迭代计算出ak,k=0,1,…,K0,则得到:
其中,表示由向量组成的矩阵,表示待优化参数向量,θT为θ的转置;
(225)采用激活函数对f2进行处理,得到第一个卷积层的输出信号f3;
步骤(23)具体包括:
(231)采用图粗化方法将第一个卷积层的网络结构G1中连接最密切的顶点聚类,即每次从G1未被标记的顶点中挑选出满足以下条件的点对{i,j}进行标记:
其中,表示使得取得最大值所对应的点对{i,j},A1表示G1的权重邻接矩阵,(A1)ij、(A1)ij′、(A1)i′j分别表示A1第i行j列、第i行j′列、第i′行j列的元素值;
(232)重复步骤(231),直至G1中所有的顶点都被标记;
(233)将G1中每个被标记的点对{i,j}融合,作为第一个池化层的网络结构G2的一个新顶点q,G2的顶点数减少为G1的一半,将第一个卷积层的输出信号f3作为第一个池化层的输入信号,采用以下公式计算第一个池化层的输出信号f4:
其中,f4(q)表示f4在顶点q处的值,f3(i)、f3(j)分别表示f3在顶点i、j处的值;
采用以下公式计算G2的权重邻接矩阵A2:
其中,G2中的顶点q1、q2分别由G1中被标记的点对{i1,j1}、{i2,j2}融合而成,表示A2第q1行q2列的元素值,分别表示A1第i1行i2列、第i1行j2列、第j1行i2列、第j1行j2列的元素值;
步骤(3)中,所述深度遗传信息特征编码器用公式表示如下:
其中,z=(z(1))表示所述深度遗传信息特征编码器的输出信号,只有一个元素z(1),即样本的抗肿瘤药物敏感性预测值,用IC50值表示,Ω表示编码器函数,σ表示Sigmoid函数,fend=(fend(1),fend(2),…,fend(Nend))表示所述深度遗传信息特征编码器的输入信号,也即经过基因遗传信号转导深度神经网络提取得到的样本的深度遗传信息特征,共有Nend个元素,Nend为基因遗传信号转导深度神经网络的最后一个池化层的顶点数,fend(l),l=1,2,…,Nend表示fend的第l个元素,w(l),l=1,2,…,Nend表示所述深度遗传信息特征编码器的输入信号与输出信号之间的第l个链接权重,也是待优化参数,随机初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010490247.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种眼科用色盲快速测试设备
- 下一篇:一种下肢康复机器人用背部连接装置