[发明专利]基于深度学习的药物预测方法和设备在审
申请号: | 202110053416.X | 申请日: | 2021-01-15 |
公开(公告)号: | CN112635080A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 杨东;许田 | 申请(专利权)人: | 复星领智(上海)医药科技有限公司 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16B30/00;G16B20/50;G16C20/30;G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 吕玥;冯园园 |
地址: | 200437 上海市虹口区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 药物 预测 方法 设备 | ||
1.一种计算机实施的药物预测方法(100),其特征在于,所述方法(100)包括:
接收从一个对象的肿瘤样本导出的基因组特征向量(130),所述基因组特征向量表示肿瘤的基因突变信息;
接收从所述肿瘤样本导出的转录组特征向量(140),所述转录组特征向量表示所述肿瘤的基因表达水平;
根据一种药物的化学结构,导出所述药物的分子结构特征向量(150);并且
将所述基因组特征向量和所述转录组特征向量中的至少一个以及所述分子结构特征向量输入经训练的深度神经网络,以确定所述药物对该肿瘤是否有效(160)。
2.根据权利要求1所述的方法(100),其特征在于,所述方法还包括:
接收针对所述对象的所述肿瘤样本和正常样本的各自的基因组测序数据(110);并且
接收针对所述对象的所述肿瘤样本的转录组测序数据(120);
其中,所述基因组特征向量是通过参照所述正常样本的基因组测序数据对所述肿瘤样本的基因组测序数据进行变异检测来确定的,并且
其中,所述转录组特征向量是根据从所述转录组测序数据导出的所述肿瘤的基因表达值来确定的。
3.根据权利要求1或2所述的方法(100),其特征在于,所述方法还包括:
根据所述药物所针对的靶向通路及特点,确定所述药物的药物靶标特征向量(155);并且
附加地将所述药物靶标特征向量输入所述经训练的深度神经网络,以确定所述药物对该肿瘤是否有效。
4.根据权利要求3所述的方法(100),其特征在于,所述药物靶标特征向量是通过根据所述药物的分子化合物的作用机制对所述药物进行分类,然后编码得到的。
5.根据权利要求1或2所述的方法(100),其特征在于,所述分子结构特征向量是根据所述药物的分子化合物中的原子特征、化学键特征以及原子间的连接关系计算得到的,
其中,所述原子特征选自以下特征构成的组中的至少一个特征:原子种类、原子质量、手性、芳香性、杂化轨道类型、与之相连的化学键数目、与之相连的氢原子数目,以及原子所带形式电荷;
其中,所述化学键特征选自以下特征构成的组中的至少一个特征:化学键的类型、共轭、成环,以及立体特性;并且
其中,所述原子间的连接关系指示所述分子化合物中各个原子之间的相互连接关系。
6.根据权利要求5所述的方法(100),其特征在于,所述导出包括将针对所述药物的分子化合物的化合物分子图输入所述深度神经网络中的图神经网络(GNN)并按照所述原子间的连接关系依次提取所述分子化合物中每个原子及化学键上的特征来计算所述分子结构特征向量(145),其中,所述化合物分子图包含有关所述原子特征、化学键特征以及原子间的连接关系的信息。
7.根据权利要求1或2所述的方法(100),其特征在于,所述输入包括:
将所述基因组特征向量和所述转录组特征向量中的至少一个与至少所述分子结构特征向量合并串联后形成输入特征向量;并且
将所述输入特征向量输入所述经训练的深度神经网络,以确定所述药物对该肿瘤是否有效。
8.根据权利要求7所述的方法(100),其特征在于,所述输入还包括:
依次将针对至少一种药物中的每种药物的所述输入特征向量输入所述经训练的深度神经网络,以计算每种药物对该肿瘤有效的概率。
9.根据权利要求8所述的方法(100),其特征在于,所述至少一种药物包括至少两种药物,
其中,所述输入还包括:对所述至少两种药物的有效概率进行排序,以选出最有效的药物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复星领智(上海)医药科技有限公司,未经复星领智(上海)医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110053416.X/1.html,转载请声明来源钻瓜专利网。