[发明专利]一种药物作用后差异转录表达谱及药物适应症的预测方法有效
申请号: | 202210257005.7 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114360743B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 季序我;彭鑫鑫;余丹阳 | 申请(专利权)人: | 普瑞基准生物医药(苏州)有限公司;普瑞基准科技(北京)有限公司;北京普康瑞仁医学检验所有限公司 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G06K9/62;G16B20/00;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 北京动力号知识产权代理有限公司 11775 | 代理人: | 董钢 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 药物 作用 差异 转录 表达 适应症 预测 方法 | ||
1.一种药物作用后差异转录表达谱及药物适应症的预测方法,其特征在于,包括:
S1,建立预测药物作用后差异转录表达谱的深度学习模型;
S2,基于所述深度学习模型进行药物作用后差异转录表达谱的预测,所述预测包括在不同细胞系、不同扰动时长与不同药物剂量条件下的差异转录表达谱;以及
S3,将预测获得的所述药物作用后差异转录表达谱与已有药物的差异转录表达谱进行相似性比较,根据相似性比较结果预测所述药物的适应症;
所述S1,建立预测药物作用后差异转录表达谱的深度学习模型包括:
S11,获得建立所述深度学习模型的样本,对样本进行预处理获得样本数据;以及
S12,构建所述深度学习模型;
所述S11包括:
S111,从基因表达综合数据库中获取特定数据库,并采集其中特定级别的数据;
S112,对特定级别的数据进行数据清理,包括:保留基因表达综合数据库中测序平台直接测量的多个基因数据作为初始基因数据;删除无法使用rdkit以及语法变异自动编码器无法读取的药物数据后获得初始药物数据;删除所述特定级别的数据中平均皮尔森相关系数小于第一阈值的差异转录表达谱实验数据获得初始差异转录表达谱实验数据;删除出现次数小于第二阈值的细胞系数据获得初始细胞系数据;所述初始基因数据、初始药物数据、初始差异转录表达谱实验数据以及初始细胞系数据构成所述深度学习模型的样本数据;
所述S12包括:
S121,模型训练;
S122,模型有效性验证,包括:
基于所述S121中训练好的所述深度学习模型对平均皮尔森相关系数小于第一阈值的差异转录表达谱的实验数据进行预测,如果预测的差异转录表达谱与实验结果的相关系数大于第三阈值,则将该实验数据重新加入之前保留下来的所述样本数据后重新进行步骤S121;如果预测的差异转录表达谱与实验结果的相关系数小于第三阈值,则继续步骤S123;
S123,基于所述模型训练和模型有效性验证,从而获得深度学习模型。
2.根据权利要求1所述的一种药物作用后差异转录表达谱及药物适应症的预测方法,其特征在于,所述药物作用后差异转录表达谱适用于小分子药物扰动细胞系实验。
3.根据权利要求1所述的一种药物作用后差异转录表达谱及药物适应症的预测方法,其特征在于,所述模型训练包括一轮或者多轮,其中每一轮所述模型训练包括:
(1)从所述样本数据中随机选取80%的样本数据作为训练集,20%的样本数据作为测试集,所述训练集与所述测试集用于进行所述深度学习模型的训练与评估;
(2)基于语法变异自动编码器中的简化分子输入线输入系统以及权重文件对所述初始药物数据中药物化学分子式进行编码,获得56维特征向量以表示所述药物的分子信息;
(3)基于初始细胞系数据以及癌症细胞系百科全书中的转录表达数据,使用主成分分析算法对所述初始细胞系数据中的每个细胞系的基因表达谱进行降维处理,选取前11个主成分以表示对应细胞系的成分,从而保留超过90%的细胞系信息量;
(4)建立所述深度学习模型的基础模型,其中所述56维特征向量、所述11个主成分、药物剂量和药物的不同扰动时长作为所述基础模型的输入,多个基因的差异转录表达值作为所述基础模型的输出,所述基础模型使用5层全连接神经网络;
(5)以余弦相似性作为目标优化函数,使用Adam优化器作为下降方法,利用所述训练集中的数据训练所述深度学习模型。
4.根据权利要求1所述的一种药物作用后差异转录表达谱及药物适应症的预测方法,其特征在于,所述S2,基于所述深度学习模型进行药物作用后差异转录表达谱的预测,所述预测包括在不同细胞系、不同扰动时长与不同药物剂量条件下的差异转录表达谱包括:
将通过语法编译自动编码器对药物化学分子式编码获得的特征向量、不同细胞系表达数据的主成分、药物的不同扰动时长和/或药物的不同剂量作为所述深度学习模型的输入,获得所述药物的差异转录表达谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普瑞基准生物医药(苏州)有限公司;普瑞基准科技(北京)有限公司;北京普康瑞仁医学检验所有限公司,未经普瑞基准生物医药(苏州)有限公司;普瑞基准科技(北京)有限公司;北京普康瑞仁医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210257005.7/1.html,转载请声明来源钻瓜专利网。