[发明专利]分子指纹的提取及基于其的相关度的计算的方法及装置在审

专利信息
申请号: 202010988652.6 申请日: 2020-09-18
公开(公告)号: CN112201314A 公开(公告)日: 2021-01-08
发明(设计)人: 李相彬;周杰龙 申请(专利权)人: 北京望石智慧科技有限公司
主分类号: G16C20/50 分类号: G16C20/50
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 李博洋
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分子 指纹 提取 基于 相关 计算 方法 装置
【说明书】:

发明公开了一种分子指纹的提取及基于其的相关度的计算的方法及装置,其中,该分子指纹的提取方法包括:获取待测分子的多个字符;根据多个字符以及预设字符字典,分别确定各字符对应的特征向量;根据特征向量及分子指纹提取模型提取待测分子的分子指纹。通过实施本发明,解决了相关技术中存在的基于人工设计的分子特征确定的分子指纹无法描述分子的整体结构,导致的即使结构较为相似,但是分子的潜在活性方面并不相关的问题,获取分子的关键特征信息,获得较为精准的分子活性相关度信息,可以准确地评价分子相似性,从而可以使基于配体的虚拟筛选会更加准确和高效,从而有效缩减虚拟筛选所需时间。

技术领域

本发明涉及数据处理与分析领域,具体涉及一种分子指纹的提取及基于其的相关度的计算的方法及装置。

背景技术

寻找有活性的潜在分子是药物设计和发现过程中很关键的一环,可以将有活性的潜在分子命名为HIT分子。通常药化专家会利用计算机等相关技术来进行辅助,加速寻找HIT分子的过程,虚拟筛选便是其中很重要的技术之一。一般利用分子指纹来确定参考配体与候选配体的相似性,也就是进行分子的虚拟筛选过程。分子指纹是分子的抽象表征,将分子转换为一串比特串,根据各种向量相似性的计算方式,在分子之间进行比较。

现有技术中的分子指纹如下:(1)基于子结构的分子指纹,根据给定结构列表中某些子结构或特征的存在与否来设置比特串;(2)基于拓扑或路径的分子指纹(Topologicalor Path Based Fingerprint),可以是通过分析从一个原子直至到达指定数量键的路径上所有的分子片段,哈希每个路径中的片段,产生指纹;(3)圆形分子指纹(CircularFingerprint),以某个重原子为中心,搜寻一个固定半径长度的分子片段,然后将这些片段的结构特征进行哈希;(4)药效团指纹(Pharmacophore Fingerprint),以类似于基于子结构的指纹方式编码分子的结构特征,以及特征之间的距离,按照距离范围对其进行分类生成比特串。

由此看出,不同的分子指纹有不同的实现方式,也有不同侧重的方面,但是在虚拟筛选的过程中,使用分子指纹的目的是为了找到活性比较接近的分子。且现有的分子指纹都是基于人工设计的分子特征所确定的,对分子整体结构的描述不够完全,因此导致即使结构上较为相似,但是在分子潜在活性方面并不接近。

发明内容

因此,本发明要解决的技术问题在于克服现有技术中的对分子整体结构的描述不够完全,导致挑选出的分子,即使结构上较为相似,但是在分子潜在活性方面并不接近的缺陷,从而提供一种分子指纹的提取及基于其的相关度的计算的方法及装置。

根据第一方面,本发明实施例提供了一种分子指纹的提取方法,包括:获取待测分子的多个字符;根据多个字符以及预设字符字典,分别确定各所述字符对应的特征向量;根据所述特征向量及分子指纹提取模型提取所述待测分子的分子指纹。

结合第一方面,在第一方面第一实施方式中,根据所述特征向量及分子指纹提取模型提取所述待测分子的分子指纹,具体包括:根据初始字符的特征向量以及预设输入状态,生成所述初始字符的隐状态以及所述初始字符对应的初始编码长短期记忆链单元的输出状态;根据第n-1个字符对应的特征向量以及第n-2个字符对应的编码长短期记忆链单元的输出状态,生成所述第n-1个字符的隐状态以及第n-1个字符对应的第n-1个编码长短期记忆链单元的输出状态,n≥3;根据第n个字符对应的特征向量以及第n-1个字符对应的编码长短期记忆链单元的输出状态,生成所述第n个字符的隐状态以及所述待测分子的分子指纹。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京望石智慧科技有限公司,未经北京望石智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010988652.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top