[发明专利]一种分子生成方法和计算设备在审
申请号: | 202010621991.0 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111816265A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 张琳;范方达;李远鹏;赖力鹏;温书豪;马健 | 申请(专利权)人: | 北京晶派科技有限公司 |
主分类号: | G16C20/50 | 分类号: | G16C20/50 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分子 生成 方法 计算 设备 | ||
本发明公开了一种分子生成方法,在计算设备中执行,计算设备中存储有分子片段库,该片段库中的分子片段具有节点向量,该方法包括:生成一个多维向量作为一个生成分子的树向量,树向量代表该生成分子的联结树,联结树的节点为由生成分子拆分出的多个分子片段,相邻的分子片段用边连接;从作为全零向量的空节点开始,采用预设的解码模型依次判断每个当前节点之后是否需要新增下一节点,并在需要新增时,基于树向量和当前节点向量从分子片段库中选取下一节点所对应的分子片段,从而得到联结树;以及确定联结树中相邻分子片段之间的连接方式,并采用该连接方式对相邻分子片段进行连接,得到生成分子。本发明还一并公开了用于执行该方法的计算设备。
技术领域
本发明涉及计算机技术领域,尤其涉及一种分子序列的生成方法、装置和计算设备。
背景技术
众所周知,药物研发是一个漫长的过程,存在着研发周期长,研发成果率低,研发费用高的困境。而随着计算机技术的更新以及大数据技术的发展,人工智能正在各行各业中发挥巨大的应用价值,在制药行业也受到了广泛的关注。药物发现的关键挑战是找到具有所需化学性质的靶分子。当前,这项任务需要专业化学家和药理学家多年的开发和探索。而对于分子量在500Da以内的类药小分子,其种类估计达到10的30至60次方,只靠人类的认知很难广泛探索,因此需要借助计算机来帮助人类寻找新的分子。
发明内容
鉴于上述问题,本发明提出了一种分子生成方法和计算设备,以力图解决或者至少解决上面存在的问题。
根据本发明的一个方面,提供了一种分子生成方法,适于在计算设备中执行,该计算设备中存储有分子片段库,该分子片段库包括从多个已知分子中拆分出的多个分子片段,每个分子片段具有向量表示,该方法包括步骤:生成一个多维向量作为一个生成分子的树向量,该树向量适于代表该生成分子的联结树,该联结树的节点为由生成分子拆分出的多个分子片段,相邻的分子片段用边连接;从作为全零向量的空节点开始,采用预设的解码模型依次判断每个当前节点之后是否需要新增下一节点,并在需要新增时从分子片段库中选取下一节点所对应的分子片段,从而得到所述联结树;以及确定联结树中相邻分子片段之间的连接方式,并采用该连接方式对相邻分子片段进行连接,得到所述生成分子。
可选地,在根据本发明的分子生成方法中,生成一个多维向量作为树向量的步骤包括:根据预设的树向量维度和分布特点随机生成一个对应维度的向量作为所述生成分子的树向量。
可选地,在根据本发明的分子生成方法中,生成一个多维向量作为树向量的步骤包括:接收用户的输入分子,将该输入分子拆分为多个分子片段;将其中一个分子片段作为根节点,并根据各分子片段之间的连接关系生成输入分子的联结树;采用预设的编码模型对输入分子的联结树进行编码,得到对应的树向量;对输入分子的树向量叠加微小扰动后,得到生成分子的树向量。
可选地,在根据本发明的分子生成方法中,编码模型的输入为第一组合向量、输出为从当前节点指向下一节点的出链边向量,第一组合向量包括当前节点向量和指向当前节点的入链边向量,当前节点的入链边向量为上一节点的出链边向量。
可选地,在根据本发明的分子生成方法中,采用预设的编码模型对所述输入分子的联结树进行编码的步骤包括;从该联结树的叶子节点开始,基于编码模型向根节点方向依次计算每个节点的出链边向量,以得到根节点的入链边向量;以及将根节点向量和根节点的入链边向量进行拼接,并经过全连接层降维后,得到输入分子的树向量。
可选地,在根据本发明的分子生成方法中,若根节点有多个入链边向量,则将根节点向量和根节点的入链边向量进行拼接的步骤包括:将该多个入链边向量进行求和之后,与根节点向量进行拼接。
可选地,在根据本发明的分子生成方法中,解码模型的输入为第二组合向量、输出为当前节点之后是否新增子节点,第二组合向量包括当前节点向量、指向当前节点的入链边向量之和、以及生成分子的树向量;其中,初始的当前节点为空节点,其当前节点向量和指向当前节点的入链边向量均为全零向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶派科技有限公司,未经北京晶派科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010621991.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手指检测方法
- 下一篇:可水洗紫外光固化水性聚氨酯树脂及其制备方法和应用