[发明专利]一种通过建立QSAR模型预测化学品以斑马鱼胚胎为受体的毒性的方法有效
申请号: | 201911139387.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110910970B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陈景文;吴思甜;李雪花 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/30 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 建立 qsar 模型 预测 化学品 斑马 胚胎 受体 毒性 方法 | ||
1.一种通过建立QSAR模型预测化学品以斑马鱼胚胎为受体的毒性的方法,其特征在于,步骤如下:
使用348种化合物,根据其不同的作用方式建立相应的QSAR模型;首先确定出348种化合物的作用方式分为六类,分别是惰性化合物、弱惰性化合物质、反应性化合物、按特定机制作用化合物、无法分类的含COOR化合物,以及无法分类的不含COOR化合物;将每一类化合物按照4:1随机拆分为训练集和验证集;训练集中的化合物用于构建模型,验证集中的化合物用于评估模型的外部预测能力;对数据集中的化合物进行优化,得到相应化合物的稳定构型,基于结构提取Dragon描述符,采用MLR回归分析方法筛选分子描述符和构建预测模型;
(1)惰性化合物预测模型:
logLC50=-1.556SM4_B(p)+13.738(R5e+)–1.983Mor16m–0.223RDF075m+7.375 (1)
其中,ntra=30,R2tra=0.91,R2adj.tra=0.89,RMSEtra=0.51,Q2LOO=0.85,next=9,R2ext=0.85,RMSEext=0.59;SM4_B(p)是由极化率加权的负荷矩阵得到的4阶谱矩;R5e+是lag5处的R滞后最大自相关或桑德森电负性加权;Mor16m是信号16或由质量加权;RDF075m是径向分布函数-075或由质量加权;ntra和next分别是训练集和验证集化合物数量;R2是决定系数,R2adj是校正的决定系数;RMSE是均方根误差;Q2LOO是去一法交叉验证系数;
(2)弱惰性化合物预测模型:
logLC50=-0.962SpMax5_Bh(s)+0.689nHDon+0.391GATS5s+0.177Mor08i+0.922 (2)
其中,ntra=18,R2tra=0.98,R2adj.tra=0.97,RMSEtra=0.13,Q2LOO=0.96,next=6,R2ext=0.94,RMSEext=0.34;SpMax5_Bh(s)是负荷矩阵5号最大特征或由I-state加权;nHDon是氢键供体原子数;GATS5s是在lag5处的Geary自相关或由I-state加权;Mor08i是信号08或由电离势加权;
(3)反应性化合物预测模型:
logLC50=-0.013P_VSA_e_2–1.48B09[C-O]+0.607Hy–12.256(R4p+)+1.463nOHp+0.281(3)
其中,ntra=35,R2tra=0.86,R2adj.tra=0.84,RMSEtra=0.44,Q2LOO=0.78,next=10,R2ext=0.78,RMSEext=0.56;P_VSA_e_2是类P_VSA对桑德森电负性的影响,bin 2;B09[C-O]是在拓扑距离9处存在或不存在C-O;Hy是亲水因子;R4p+是lag4处的R最大自相关或由极化率加权;nOHp是初级醇的数量;
(4)按特定机制作用化合物预测模型:
logLC50=-0.221RDF085p+0.887Eig10_EA(dm)–1.833B09[C-S]+0.927GATS7i–0.698Mor28m–1.93 (4)
其中,ntra=47,R2tra=0.82,R2adj.tra=0.80,RMSEtra=0.39,Q2LOO=0.75,next=12,R2ext=0.76,RMSEext=0.47;RDF085p是径向分布函数-085或由极化率加权;Eig10_EA(dm)是来自边缘邻接垫的10号特征值或由偶极矩加权;B09[C-S]是在拓扑距离9处存在或不存在C–S;GATS7i是在lag7处的Geary自相关或由电离势加权;Mor28m是信号28或由质量加权;
(5)无法分类的含COOR化合物预测模型:
logLC50=-4.96TDB10m+2.479nOHp–1.592MATS7s+1.659NssNH–0.367L3s–1.382 (5)
其中,ntra=32,R2tra=0.88,R2adj.tra=0.86,RMSEtra=0.39,Q2LOO=0.83,next=8,R2ext=0.76,RMSEext=0.43;TDB10m是基于三维拓扑距离的描述符-lag10或由质量加成;nOHp是初级醇的数量;MATS7s是在lag7处的Moran自相关或由I-state加权;NssNH是类型为ssNH的原子数;L3s是第三组件的大小方向的WHIM指数或由I-state加权;
(6)无法分类的不含COOR化合物预测模型:
logLC50=-2.496SM6_B(p)+0.184Eta_betaS–0.419Eig10_AEA(dm)–6.637X3A+0.694B03[O-O]+19.193 (6)
其中,ntra=110,R2tra=0.71,R2adj.tra=0.70,RMSEtra=0.69,Q2LOO=0.68,next=31,R2ext=0.74,RMSEext=0.39;SM6_B(p)是由极化率加权负荷矩阵得到的6阶谱矩;Eta_betaS是eta sigma VEM数量;Eig10_AEA(dm)是来自增广边缘邻接垫的10号特征值或由偶极矩加成;X3A是3阶的平均连通性指数;B03[O-O]是拓扑距离3上O-O存在或不存在。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911139387.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:红外视频的去竖条纹方法
- 下一篇:钣金件的加工系统、剪切装置及其压料机构