[发明专利]使用强化学习的分子设计在审
申请号: | 201980033304.9 | 申请日: | 2019-03-29 |
公开(公告)号: | CN112136181A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | D.普拉姆利;M.H.S.塞格勒 | 申请(专利权)人: | 伯耐沃伦人工智能科技有限公司 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张贵东 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 强化 学习 分子 设计 | ||
提供了使用机器学习(ML)技术来设计表现出一项或多项所需性质的化合物的(多个)方法、装置和(多个)系统。这可以通过以下方法来实现:使用基于(多项)所需性质和用于修饰化合物的规则集合修饰第一化合物的ML技术来生成第二化合物;基于(多项)所需性质对第二化合物评分;基于评分确定是否重复生成步骤;以及在重复生成步骤之前基于评分更新所述ML技术。
技术领域
本申请涉及使用机器学习技术来设计表现出一项或多项所需性质的化合物的装置、系统和方法。
背景技术
信息学是在一个或多个学术和/或科学领域中用于解释数据的计算机、信息技术和资源应用。化学信息学和生物信息学包括用于解释化学和/或生物数据的计算机、信息技术和资源应用。这可以包括解决和/或模拟化学和/或生物学领域中的过程和/或问题。例如,这些计算、信息技术和资源可以将数据转换为信息,并且随后将信息转换为知识,用于快速产生化合物和/或做出改进后的决定,仅作为示例而不限于药物鉴定、研发和优化领域。
机器学习技术是可用于设计复杂分析模型和算法的计算方法,该复杂分析模型和算法适于解决复杂问题,例如产生或预测具有所需特性和/或性质的化合物。存在可用于或可被选择用于产生化合物的多种机器学习技术,但没有一种可用于基于所需特性或性质的集合来产生或优化化合物。期望使用机器学习技术以使得研究者、数据科学家、工程师和分析师在药物鉴定、研发和优化领域实现快速改进。
下面描述的实施例不限于解决了上述已知方法的部分或全部不足之处的实现方式。
发明内容
本节是为了以简化的形式介绍将在下文具体实施方式一节中进一步描述的一些概念。本节不旨在明确所述的主题的关键特征或必要特征,也不旨在用于确定所述的主题的范围;应当认为促进本发明的工作和/或用于实现基本上相似的技术效果的变型和替代特征落入在此公开的本发明的范围内。
本公开提供了使用机器学习技术来设计和生成表现出所需性质的候选分子/化合物的方法、装置和系统。机器学习技术可以依据初始化合物,学习如何扰动该化合物,直到实现具有所需性质的化合物或达到停止标准。本文描述的方法不需要人工干预,可以自动执行。导致最终化合物的所执行的规则、操作和/或扰动的序列还可以输出,并且向研究人员提供关于如何形成化合物以及化合物具有所需性质和/或特性的其他见解和/或证据。
在第一方面,本公开提供了一种使用机器学习技术来设计表现出一项或多项所需性质的化合物的由计算机实现的方法,该方法包括:使用基于所需性质和用于修饰化合物的规则集合来修饰第一化合物的机器学习技术来生成第二化合物;基于所需性质对第二化合物评分;基于评分确定是否重复生成步骤;以及在重复生成步骤之前基于评分更新机器学习技术。
优选地,确定是否重复生成步骤基于评分,该评分指示第二化合物更加接近于表现出所需性质的化合物。
优选地,确定是否重复生成步骤基于评分,该评分指示第二化合物表现出所需性质。
优选地,确定是否重复生成步骤还包括确定是否已经实现了重复生成步骤的预定次数的迭代。
优选地,确定是否重复生成步骤还包括:基于表现出至少一项或多项所需性质的第二化合物,确定对第二化合物的任何进一步改进是否可能。
优选地,生成第二化合物还包括生成第二化合物集合;以及基于所需性质对第二化合物集合进行评分。
优选地,该方法还包括:基于评分对第二化合物集合进行分级,其中产生第二化合物还包括基于层级最高的第二化合物集合产生其他第二化合物。
优选地,该规则集合还包括表示与修饰化合物相关的一个或多个操作的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯耐沃伦人工智能科技有限公司,未经伯耐沃伦人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980033304.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于主动学习的候选列表选择模型
- 下一篇:主动学习模型验证