[发明专利]增量宽度和深度学习的药物反应预测方法、介质和设备在审

申请号：	202210464986.2	申请日：	2022-04-29
公开（公告）号：	CN114841261A	公开（公告）日：	2022-08-02
发明（设计）人：	陈俊龙;詹永康;孟献兵	申请（专利权）人：	华南理工大学
主分类号：	G06K9/62	分类号：	G06K9/62;G16H20/10
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	霍健兰
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	增量宽度深度学习药物反应预测方法介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种增量宽度和深度学习的药物反应预测方法、介质和设备；其中方法为：将药物的序列进行文本编码和位置编码，构建药物信息编码；将药物信息编码输入到Transformer编码器中挖掘药物的结构化特征，同时把基因表达数据输入到多层感知机学习基因的特征表示，将药物特征和基因特征拼接在一起形成药物‑基因特征对；将特征对输入到宽度学习系统中得到预测的药物敏感度回归值。该方法可解决药物表示不佳的问题；采用宽度学习系统来融合药物表示和基因表达特征，提高药物敏感性预测结果的准确性；通过增量学习算法更新网络权重，提升模型性能，无需重新训练整个模型。

技术领域

本发明涉及药物反应预测技术领域，更具体地说，涉及一种增量宽度和深度学习的药物反应预测方法、介质和设备。

背景技术

癌症是威胁人类健康和致人死亡的重要疾病，实现对癌症患者个性化治疗是精准医学最突出的研究领域之一。近年来，随着药物基因组学和计算模型的快速发展，药物反应预测技术逐渐给个性化治疗研究带来更多便利。药物反应预测旨在提取和整合药物和细胞系的基因表达信息，预测细胞系对药物的敏感性。半数最大抑制浓度(IC₅₀)可以用来反应细胞系的药物反应敏感程度，是常用的药物反应预测指标。传统的药物反应预测方法大多数是基于机器学习的方法，如支持向量机、基于贝叶斯多任务多核学习、随机森林和简单神经网络模型。这些方法依赖先验知识和特征工程来获取药物和基因特征，然后组合成新特征来预测细胞系的药物敏感性。面对复杂高维，噪声多的数据，其预测性能与泛化性不具备优势。

随着人工智能的发展，深度学习在药物反应预测和药物开发等问题中取得了卓越的突破。利用深度学习进行药物反应预测的方法大致可以分为两类，一类是基于无监督或半监督的方法，另一类是基于端到端的有监督方法。基于无监督或半监督的药物反应预测模型通常先利用自编码器来对药物文本序列和细胞系的甲基组、拷贝数变异、转录组等数据进行特征降维学习，所学习的特征再用于训练分类器，以预测细胞系对药物的敏感性。端到端的有监督方法利用了深度学习网络模块化的特性，采用卷积神经网络，深度编码器，集成深度神经网络和图神经网络等模型来提取不同类型数据的特征，并将学习到的药物和基因表示输入到预测分类器中进行训练。深度学习的方法相比于传统机器学习方法在预测性能和泛化性上有所提高，但仍不能满足临床试验的需求。目前大多数基于深度学习的药物反应预测算法还存在相当大的局限性。第一，仅采用化学描述符或分子指纹的特征工程方法缺乏对药物结构表示的考虑，不能区分药物分子中不同原子及其相关联化学键之间不同的作用信息，容易丢失潜藏的药物结构信息；第二，对药物特征和基因特征融合方式单一，依靠多层神经网络模型构建的分类器限制了性能的提升；第三，已建模的系统面对新增数据时需重新训练整个模型，极大地增加了时间成本；第四，在真实的临床实验环境中，由于隐私和产权保护和数据获取的周期不一，无法一次性获取全部训练样本。目前的药物反应预测模型还不具备增量式地学习多批次数据的能力。

综上，目前基于深度学习的药物反应预测方法存在改进空间。

发明内容

为克服现有技术中的缺点与不足，本发明的目的在于提供一种增量宽度和深度学习的药物反应预测方法、介质和设备；该方法通过Transformer编码器学习药物SMILES序列的结构化特征，解决药物分子中不同原子及其相关联化学键之间不同的作用信息无法区分的问题；采用宽度学习系统来融合药物表示和基因表达特征，提高药物敏感性预测结果的准确性；通过增量学习算法更新网络权重，提升模型性能，无需重新训练整个模型。

为了达到上述目的，本发明通过下述技术方案予以实现：一种增量宽度和深度学习的药物反应预测方法，其特征在于：包括如下步骤：

S1，将药物的SMILES序列进行文本编码和位置编码，得到文本编码T_i和位置编码P_i，从而构建药物信息编码E_i；其中，i＝1，2，...，L；L表示最大药物字符串序列长度；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210464986.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种建筑工程施工用噪音检测处理装置及处理方法
下一篇：一种用于智慧能源物联网系统的物联网智能网关

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]增量宽度和深度学习的药物反应预测方法、介质和设备在审

专利文献下载