[发明专利]采用定量结构-活性关系模型预测有机化学品的氯自由基反应速率常数的方法有效

专利信息
申请号: 201710764713.9 申请日: 2017-08-30
公开(公告)号: CN107563133B 公开(公告)日: 2021-05-04
发明(设计)人: 谢宏彬;张勇虔;李雪花;陈景文 申请(专利权)人: 大连理工大学
主分类号: G16C20/60 分类号: G16C20/60;G16C20/70
代理公司: 大连格智知识产权代理有限公司 21238 代理人: 郭悦
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了采用定量结构‑活性关系模型预测有机化学品的氯自由基反应速率常数的方法。仅通过有机化学品的基本分子结构信息,计算出具有结构特征的量子化学描述符,并采用所构建的QSAR预测模型,即可快捷、高效的预测有机化学品的kCl值。该方法遵循经济合作与发展组织(OECD)颁布的QSAR模型构建及验证导则:采用遗传算法‑多元线性逐步回归分析联用法(GA‑MLR)和支持向量机‑多元线性逐步回归分析联用法(SVM‑MLR),透明度高且便于应用;GA‑MLR模型均采用量子化学描述符,因此描述符物理意义清晰;具有明确的应用域,适用的有机物种类丰富;具有良好的拟合优度、稳健性以及预测能力,易于程序化,能为有机化学品的环境风险评价与管理提供重要的数据支持。
搜索关键词: 采用 定量 结构 活性 关系 模型 预测 有机 化学品 自由基 反应 速率 常数 方法
【主权项】:
一种采用定量结构‑活性关系模型预测有机化学品的氯自由基反应速率常数的方法,其特征在于:包括如下步骤,(1)收集温度为298K的506种有机化合物的kCl值,其中,含有多条kCl数值记录的有机化合物,对其取平均值;(2)对于步骤(1)中收集得到的506种有机化合物,使用量子化学计算软件进行电子结构优化,采用方法为B3LYP,其中C,O,H,Cl,S,F,Br,Se和N原子,采用6‑311+G(d,p)基组,Si,I原子,采用LANL2DZ基组,采用随机数据分割法将有机化合物以4:1的比例划分为训练集和验证集,训练集中有403种有机化合物,验证集中有103种有机化合物;(3)遗传算法‑多元线性逐步回归分析模型中描述符的计算:基于步骤(2)优化得到的有机化合物电子结构,计算出量子化学描述符65种,其中,基础量子化学描述符17种,四元素描述符18种,符合型量子化学描述符21种,并加以qHave,qOave,#nonHatom:C,#X:C,#F:C,#Cl:C,#Br:C,#I:C,#S:C量子化学描述符9种进行模型的构建;(4)支持向量机‑多元线性逐步回归分析模型中描述符的计算:基于步骤(2)优化得到的有机化合物电子结构,计算描述符1490种,包括DRAGON描述符1489种,量子化学描述符EHOMO 1种;(5)将步骤(1)中收集得到的506种有机化合物的kCl值进行对数变换,获得logkCl形式的数值用于后续模型的构建;(6)将步骤(3)中计算得到的量子化学描述符和步骤(5)中计算得到的训练集中的403种有机化合物logkCl数值整合,首先使用机器学习方法遗传算法对量子化学描述符进行变量选择降维,随后采用多元线性逐步回归分析去除描述符的多重共线性并构建模型,模型见式1;将步骤(4)和(5)中计算得到的描述符和训练集的有机化合物logkCl数值整合,使用支持向量机从1490个描述符中选择出平均影响值高的前60种描述符,随后采用多元线性逐步回归分析去除描述符的多重共线性并构建模型,模型见式2;logkCl=3.516+14.33EHOMO–0.1380#X:C–8.950qHave–0.8520qCave‑31.17(ELUMO‑EHOMO)2–0.5160#nonHatom:C–2.219S–0.6360s‑max+0.0530#H  (1)logkCl=‑5.923+15.66EHOMO+0.2660SsssCH–1.010JGI1+0.3280R3i–1.137R2e+0.9320R2u+0.5390nR=Cp–0.3210HATS3u–0.4970nRCO+0.3810DLS_05  (2)其中,EHOMO表示有机化合物的最高占据分子轨道能量,#X:C表示有机化合物中卤原子数目与碳原子数目的比值,qHave表示氢原子平均电荷,qCave表示碳原子平均电荷,(ELUMO‑EHOMO)2表示前沿轨道能级差的平方,#nonHatom:C表示有机化合物中非氢原子数目与碳原子数目的比值,S表示有机化合物的化学软度,s‑max表示有机化合物局部软度,#H表示氢原子数目,SsssCH与原子过渡态能量有关,JGI1与有机化合物平均拓扑电荷指数有关;R3i、R2e、R2u和HATS3u是GETAWAY描述符,R3i与有机化合物电离势有关,R2e与Sanderson电负性有关,R2u与lag2状态下的R自相关指数有关,HATS3u与lag3状态下的杠杆自相关指数有关;nR=Cp表示有机化合物末端sp2杂化的主碳数目,DLS_05与改良的药物打分规则有关,nRCO表示有机化合物中酮类官能团个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710764713.9/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top