[发明专利]基于机器学习的高生成热含能材料的自适应设计方法有效
申请号: | 202010820598.4 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112002380B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 蒲雪梅;谢沄浩;覃潇;郭延芝;刘建;徐涛 | 申请(专利权)人: | 四川大学 |
主分类号: | G16C60/00 | 分类号: | G16C60/00;G06N20/00 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 刘妮 |
地址: | 610065 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 生成 热含能 材料 自适应 设计 方法 | ||
1.基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:包括以下步骤:
S1,构建含能材料搜索空间,获得具有已知特征描述符和量化计算生成热的初始数据集;
S2,使用初始数据对模型进行训练,学习含能化合物特征描述符-生成热属性关系;
S3,将训练后的模型应用于未知搜索空间,以预测未知化合物的生成热以及获得它们相关的方差;
S4,使用选择器全局优化搜索,为量化计算提供下一个最佳候选物;
S5,理论计算验证候选物生成热;
S6,将新的化合物添加到初始数据集,进行新一轮设计,迭代循环找到具有高生成热化合物。
2.根据权利要求1所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:含能材料搜索空间为88个含能母环与14个取代基之间的单取代和二取代的所有组合可能,结构检查与去除重复,获得97566个化合物,其中单取代化合物3416个,二取代化合物94150个。
3.根据权利要求2所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:初始数据收集:从97566个化合物中选取了88个代表性化合物,按照单取代和二取代化合物数量比,选取了单取代化合物3个,二取代化合物85个,并确保了每个含能母环选取1次以及每个取代基选取12~13次,以确保初始样本集的代表性,由此构建了88个化合物的初始数据集。
4.根据权利要求3所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:特征描述符:统计了97566样本的键类型,利用分子指纹将分子图转换为整数向量,采用2048位扩展连接指纹,对图的子结构信息进行编码,通过二进制方式来表示存在或不存在的唯一组分,其长度由用户控制;E-state指纹长度较短,适合用于化合物数据量较少时的特征描述符,在计算97566个含能化合物的E-state描述符发现只存在13种原子类型,因此将E-state描述符截短到只有13个长度;设计一个将SOB描述符与E-state描述符组合在一起的特征描述符:E-state+SOB,综合化学键信息与电子拓扑状态信息,SOB描述符为首先枚举数据集中的所有键类型,然后计算每个分子中每个键的数量,每个分子描述符包含每种类型的键出现的次数的整数。
5.根据权利要求4所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:模型选择回归器模型:其选用6种机器学习回归模型,包括最小二乘法的线性回归模型、径向基核的支持向量回归模型、线性核的支持向量回归模型、Lasso回归模型、核岭回归模型和高斯过程回归模型,将E-state、SOB和E-state+SOB这3种描述符与6个回归模型进行组合得到18个学习模型。
6.根据权利要求5所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:选择器:使用了5个不同选择标准,结合预测结果与不确定性去选择候选化合物,以优化候选物的决策过程,5个选择器包括:Random、Exploitation、Exploration、Trade-offbetween exploitation and exploration和Knowledge Gradient algorithm。
7.根据权利要求6所述的基于机器学习的高生成热含能材料的自适应设计方法,其特征在于:计算候选物生成热:选择原子化能方法,计算含能化合物在298K下的标准气相生成热,利用生成热计算公式计算出88个化合物的气相生成热,作为它们的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010820598.4/1.html,转载请声明来源钻瓜专利网。