[发明专利]一种通过建立QSAR模型预测化学品以斑马鱼胚胎为受体的毒性的方法有效

专利信息
申请号: 201911139387.8 申请日: 2019-11-20
公开(公告)号: CN110910970B 公开(公告)日: 2022-05-13
发明(设计)人: 陈景文;吴思甜;李雪花 申请(专利权)人: 大连理工大学
主分类号: G16C20/70 分类号: G16C20/70;G16C20/30
代理公司: 大连理工大学专利中心 21200 代理人: 温福雪;侯明远
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通过 建立 qsar 模型 预测 化学品 斑马 胚胎 受体 毒性 方法
【权利要求书】:

1.一种通过建立QSAR模型预测化学品以斑马鱼胚胎为受体的毒性的方法,其特征在于,步骤如下:

使用348种化合物,根据其不同的作用方式建立相应的QSAR模型;首先确定出348种化合物的作用方式分为六类,分别是惰性化合物、弱惰性化合物质、反应性化合物、按特定机制作用化合物、无法分类的含COOR化合物,以及无法分类的不含COOR化合物;将每一类化合物按照4:1随机拆分为训练集和验证集;训练集中的化合物用于构建模型,验证集中的化合物用于评估模型的外部预测能力;对数据集中的化合物进行优化,得到相应化合物的稳定构型,基于结构提取Dragon描述符,采用MLR回归分析方法筛选分子描述符和构建预测模型;

(1)惰性化合物预测模型:

logLC50=-1.556SM4_B(p)+13.738(R5e+)–1.983Mor16m–0.223RDF075m+7.375 (1)

其中,ntra=30,R2tra=0.91,R2adj.tra=0.89,RMSEtra=0.51,Q2LOO=0.85,next=9,R2ext=0.85,RMSEext=0.59;SM4_B(p)是由极化率加权的负荷矩阵得到的4阶谱矩;R5e+是lag5处的R滞后最大自相关或桑德森电负性加权;Mor16m是信号16或由质量加权;RDF075m是径向分布函数-075或由质量加权;ntra和next分别是训练集和验证集化合物数量;R2是决定系数,R2adj是校正的决定系数;RMSE是均方根误差;Q2LOO是去一法交叉验证系数;

(2)弱惰性化合物预测模型:

logLC50=-0.962SpMax5_Bh(s)+0.689nHDon+0.391GATS5s+0.177Mor08i+0.922 (2)

其中,ntra=18,R2tra=0.98,R2adj.tra=0.97,RMSEtra=0.13,Q2LOO=0.96,next=6,R2ext=0.94,RMSEext=0.34;SpMax5_Bh(s)是负荷矩阵5号最大特征或由I-state加权;nHDon是氢键供体原子数;GATS5s是在lag5处的Geary自相关或由I-state加权;Mor08i是信号08或由电离势加权;

(3)反应性化合物预测模型:

logLC50=-0.013P_VSA_e_2–1.48B09[C-O]+0.607Hy–12.256(R4p+)+1.463nOHp+0.281(3)

其中,ntra=35,R2tra=0.86,R2adj.tra=0.84,RMSEtra=0.44,Q2LOO=0.78,next=10,R2ext=0.78,RMSEext=0.56;P_VSA_e_2是类P_VSA对桑德森电负性的影响,bin 2;B09[C-O]是在拓扑距离9处存在或不存在C-O;Hy是亲水因子;R4p+是lag4处的R最大自相关或由极化率加权;nOHp是初级醇的数量;

(4)按特定机制作用化合物预测模型:

logLC50=-0.221RDF085p+0.887Eig10_EA(dm)–1.833B09[C-S]+0.927GATS7i–0.698Mor28m–1.93 (4)

其中,ntra=47,R2tra=0.82,R2adj.tra=0.80,RMSEtra=0.39,Q2LOO=0.75,next=12,R2ext=0.76,RMSEext=0.47;RDF085p是径向分布函数-085或由极化率加权;Eig10_EA(dm)是来自边缘邻接垫的10号特征值或由偶极矩加权;B09[C-S]是在拓扑距离9处存在或不存在C–S;GATS7i是在lag7处的Geary自相关或由电离势加权;Mor28m是信号28或由质量加权;

(5)无法分类的含COOR化合物预测模型:

logLC50=-4.96TDB10m+2.479nOHp–1.592MATS7s+1.659NssNH–0.367L3s–1.382 (5)

其中,ntra=32,R2tra=0.88,R2adj.tra=0.86,RMSEtra=0.39,Q2LOO=0.83,next=8,R2ext=0.76,RMSEext=0.43;TDB10m是基于三维拓扑距离的描述符-lag10或由质量加成;nOHp是初级醇的数量;MATS7s是在lag7处的Moran自相关或由I-state加权;NssNH是类型为ssNH的原子数;L3s是第三组件的大小方向的WHIM指数或由I-state加权;

(6)无法分类的不含COOR化合物预测模型:

logLC50=-2.496SM6_B(p)+0.184Eta_betaS–0.419Eig10_AEA(dm)–6.637X3A+0.694B03[O-O]+19.193 (6)

其中,ntra=110,R2tra=0.71,R2adj.tra=0.70,RMSEtra=0.69,Q2LOO=0.68,next=31,R2ext=0.74,RMSEext=0.39;SM6_B(p)是由极化率加权负荷矩阵得到的6阶谱矩;Eta_betaS是eta sigma VEM数量;Eig10_AEA(dm)是来自增广边缘邻接垫的10号特征值或由偶极矩加成;X3A是3阶的平均连通性指数;B03[O-O]是拓扑距离3上O-O存在或不存在。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911139387.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top