[发明专利]通过定量构效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数KOA的方法无效
申请号: | 201210505935.6 | 申请日: | 2012-11-30 |
公开(公告)号: | CN102999705A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 李雪花;傅志强;陈景文;乔显亮 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 定量 关系 溶剂 模型 预测 不同 温度 辛醇 空气 分配 系数 sub oa 方法 | ||
1.通过定量构效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数KOA的方法,其特征包括以下步骤:
(1)数据搜集和划分:搜集文献中实验测定的正辛醇/空气分配系数KOA值,得到380种有机化合物在不同温度下的936个KOA数据;随机将其中264种、654个KOA值划为训练集,其余为验证集;
(2)QSAR和QSAR-T模型构建:采用多元线性回归和偏最小二乘方法构建25℃时logKOA和训练集化合物分子Dragon描述符的定量构效关系QSAR模型,表达式为:
logKOA= 0.509 + 0.986 × X1sol – 1.018 × Mor13v + 1.384 × H-050 – 1.528 × R5v – 0.015 × T(O..Cl) + 0.043 × HATS5v – 0.026 × RDF035m – 0.197 × RCI – 0.130 × nCOOR – 0.077 × Mor15u – 0.077 × RDF090m,其中,X1sol表示溶剂连接性指数chi-1;Mor13v和Mor15u是3D-MoRSE描述符;H-050表示H原子连接杂原子的碎片常数;R5v和HATS5v表示GETAWAY描述符;RDF035m和RDF090m表示径向分布函数描述符;RCI 表示芳香性指数描述符;T(O..Cl)是O和Cl原子间拓扑距离的和;nCOOR表示分子中醚键的个数;在该QSAR模型的Dragon描述符上添加温度校正后构建-10—50℃时logKOA与校正的Dragon描述符之间的温度依附性QSAR-T模型,表达式为:
logKOA = –3.03 + 3.13 ×102X1sol/T – 8.57 × 10Mor13v/T + 4.32 × 102H050/T – 1.27 × 103R5v/T – 5.54 × T(O..Cl)/T+ 1.25 × 102HATS5v/T – 1.33 × 10RDF035m/T – 6.11 × 10RCl/T – 3.76 × 10nCOOR/T +1.56 × 102Mor15u/T – 5.49 × RDF090m/T + 1.04 × 103/T;该QSAR和QSAR-T模型的校正决定系数R2adj > 0.9,累积交叉验证系数Q2CUM > 0.9;
(3)QSAR和QSAR-T模型的验证和应用域表征:QSAR和QSAR-T模型的验证结果用外部预测相关系数的平方Q2EXT和均方根误差RMSE表示;QSAR和QSAR-T模型的化合物应用域相同,均同时采用以下四种应用域表征方法:描述符距离范围法、欧几里德距离法、城市街区距离法和概率密度分布法;
(4)溶剂化模型:采用从头算的开源溶剂化模型SM8AD计算有机化合物分子在25℃时在正辛醇中的溶解自由能△GOA,由KOA的热力学原理式logKOA = -△GOA/2.303RT计算得到logKOA值;
(5)未知化合物的KOA预测:计算未知化合物的Dragon描述符,判断该描述符是否处在QSAR和QSAR-T模型应用域内;若是,则采用QSAR模型预测25℃时的KOA值,如需获得其他温度下的KOA,则采用QSAR-T模型预测;若处在域外,则采用溶剂化模型SM8AD计算获取KOA;
2.根据权利要求1所述的方法,其特征在于,所述的化合物包括烷烃类、醇类、醚类、酮类、羧酸类及取代物、苯、联苯、苯酚、多环芳烃及其取代化合物、有机农药。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210505935.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用