[发明专利]药物分类方法、装置、终端设备以及存储介质有效
申请号: | 202011035837.1 | 申请日: | 2020-09-27 |
公开(公告)号: | CN111933225B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 王俊;李朋勇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/20 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 分类 方法 装置 终端设备 以及 存储 介质 | ||
本申请实施例公开了一种药物分类方法、装置、终端设备以及存储介质,该方法适用于数字医疗。该方法包括:获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量。根据虚拟原子与n个原子中每个原子的连接关系,以及n个原子中各原子间的连接关系构建邻接矩阵,并根据n个原子和虚拟原子的属性特征向量构建原子属性特征矩阵。将邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。根据传递特征矩阵确定待检测药物分子对应的分子特征向量,将分子特征向量输入分类器以通过分类器输出待检测药物分子的药物类别。采用本申请实施例,可提高对药物分类的准确度。
技术领域
本申请涉及数据处理领域,尤其涉及一种药物分类方法、装置、终端设备以及存储介质。
背景技术
药物开发过程存在资本密度高、风险大、周期长的特点,需要投入大量的资金、人力与物力。传统的机器学习方法虽然可以在一定程度上辅助药物开发,但需要分子描述符作为特征输入,而不同的分子描述符的选择对机器学习模型的性能影响较大,因此传统的机器学习方法大多需要进行繁复、耗时的特征工程。近年新兴的深度学习方法,能够从药物的原始结构中直接提取特征,从而绕开特征工程,缩短开发周期。但是基于现有的深度学习方法所提取的药物分子的特征用于预测药物分类时,其预测精度仍有待提高。
发明内容
本申请实施例提供一种药物分类方法、装置、终端设备以及存储介质,可提高对药物分类的准确性。
第一方面,本申请实施例提供了一种药物分类方法,该方法包括:
获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量,其中,所述待检测药物分子包括n个原子,所述虚拟原子连接所述n个原子中的每个原子;
根据所述虚拟原子与所述n个原子中每个原子的连接关系,以及所述n个原子中各原子间的连接关系构建邻接矩阵,并根据所述n个原子和所述虚拟原子的属性特征向量构建原子属性特征矩阵;
将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵;
根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量,将所述分子特征向量输入分类器以通过所述分类器输出所述待检测药物分子的药物类别。
结合第一方面,在一种可能的实施方式中,所述n个原子和所述虚拟原子中任一原子的属性特征向量由所述任一原子的属性特征确定,所述任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。
结合第一方面,在一种可能的实施方式中,所述方法还包括:
获取待检测药物分子中连接各原子的化学键对应的属性特征向量,以及连接所述虚拟原子和所述n个原子中每个原子的化学键对应的属性特征向量;
根据所述各原子的化学键对应的属性特征向量和所述虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵;
所述将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵包括:
将所述化学键属性特征矩阵连同所述邻接矩阵和所述原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵。
结合第一方面,在一种可能的实施方式中,所述n个原子间的化学键和连接所述虚拟原子和所述n个原子中每个原子的化学键中任一化学键的属性特征向量由所述任一化学键的属性特征确定,所述任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征中的一个或者多个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011035837.1/2.html,转载请声明来源钻瓜专利网。