[发明专利]一种基于交互表示学习的药物特征表示方法在审
申请号: | 202111126217.3 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113851197A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 刘世超;陈思;邱洋;薛一明;章文 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/40;G06N3/04;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 崔友明 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交互 表示 学习 药物 特征 方法 | ||
1.一种基于交互表示学习的药物特征表示方法,其特征在于:包括以下步骤:
S1:收集药物的多尺度描述数据;
S2:提取药物的多尺度特征,包括采用异构图表示学习提取药物的宏观特征,采用分子图表示学习提取药物的微观特征;
S3:使用多尺度数据的双向循环交互学习机制,交互学习药物的多尺度特征表示。
2.根据权利要求1所述的一种基于交互表示学习的药物特征表示方法,其特征在于:所述的步骤S1中,具体步骤为:
S11:从药物数据库DrugBank中获取药物互作用数据、药物靶点数据和药物酶数据,并使用ID映射服务器将药物的靶点映射到药物数据库KEGG DRUG中,获得药物的代谢通路数据;
S12:从药物数据库BioGRID中获取药物和蛋白质相互作用的数据,将上述药物描述数据和它们之间各种类型的关系构建成异构的药物关联网络,获得药物的宏观维度数据;
S13:从药物数据库PubChem中获取每个药物分子的规范SMILES表示并进行预处理,将SMILES字符串依次转换为分子结构图和图数据结构的表示形式,采用节点和边分别表示原子和化学键,得到药物的微观维度数据。
3.根据权利要求1所述的一种基于交互表示学习的药物特征表示方法,其特征在于:所述的步骤S2中,提取药物的宏观特征的具体步骤为:
S21:构建面向异构图的表示学习模型;
设所有节点类型的集合为O,将每个节点vi∈V划分为特定的节点类型;所有链接类型的集合为R,将每个链接e∈E划分为特定的链接类型;设描述药物的异构网络G=(V,E)与节点类型映射函数ε:V→O和链接类型映射函数ψ:E→R相关;将药物的互作用数据、靶点、酶和代谢通路特征构建为药物的异构关联网络;
采用药物的异构图表示学习模型为每个节点学习一个特征表示即映射函数:
设|R|>1,Er包含属于类型r∈R的所有链接,则:
E=∪r∈REr,
将异构网络根据链接的类型划分为多个子网络:
Gr=(V,Er);
为每个节点在每种链接的类型上学习到统一的低维向量表示,并整合得到节点的宏观特征表示;
设节点vi在链接类型r上的邻居节点集合为Ni,r,通过随机初始化得到每个节点在链接类型r上的初始向量表示设aggregator函数为聚合函数,用于采用包括平均、池化的方式聚合信息;update函数为更新函数;
将链接类型r上的节点vi在链接类型r上的邻居信息聚合、更新得到第k阶向量表示为则定义更新公式如下:
经过K次迭代后,节点vi在链接类型r上的向量表示ui,r等价于设M为链接类型的数目,拼接节点vi在所有链接类型上的向量表示,得到节点的特征向量表示Ui:
S22:采用基于注意力机制的图神经网络框架,通过注意力机制聚合不同类型的边的信息提取药物节点的宏观特征表示;
设wr和Wr对于链接类型r是可训练的参数,采用自注意力机制计算节点的特征向量表示Ui中的线性组合的系数即链接类型r对节点vi的注意力权重:
设Dr是可训练的转化矩阵,则节点vi在链接类型r上的向量表示为:
则节点vi在异构图上学习到药物的宏观特征表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111126217.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烟尘净化器用预处理器
- 下一篇:一种基于智慧农业的滴灌培植装置