[发明专利]一种预测有机化学品的皮肤渗透系数的方法有效
申请号: | 201410676421.6 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104376221B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 范德玲;刘济宁;王蕾;汪贞;周林军;郭敏;古文;石利利 | 申请(专利权)人: | 环境保护部南京环境科学研究所 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈惠莲 |
地址: | 210042 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 皮肤渗透 描述符 预测 有机化学品 构建 定量结构活性关系 物理化学 健康风险评估 量子化学参数 计算化合物 有机化合物 表征结构 测试策略 传统试验 动物福利 分子结构 模型应用 系数预测 预测模型 预测能力 原始数据 电性能 透明的 稳健性 拟合 拓扑 算法 测试 分组 筛选 分类 清晰 应用 健康 | ||
1.一种预测有机化学品的皮肤渗透系数的方法,其特征在于:
步骤一、从收集132个化合物的皮肤渗透系数数据;
步骤二、按照K-S分组方法将步骤一的样本数据集进行分组,其中训练集共选取92个样本化合物,验证集共选取40个样本化合物;所述训练集用于构建预测模型,验证集数据用于外部验证,内部验证采用留一法交互验证;分组后的数据如下:
皮肤渗透性模型化合物信息
步骤三、建立模型:采用遗传算法进行变量选择,所使用的相关参数为:种群数100,变异概率0.5,模型中允许的最大特征个数10,其他参数均为默认值;当增加变量数目对模型结果影响不大时,筛选出影响皮肤渗透性的7个最优描述符数,采用多元线性回归方法建立了线性模型;
筛选出7种分子描述符及模型如下:
GLA-MLR线性方程:
Log Fl=–0.323–0.510BEHm8–0.316GGI2–0.064RDF030u–2.173Mor17v–0.446G2s+1.587H5m+2.546RTu+
所述BEHm8表示Burden特征值,GGI2表示拓扑电荷指数,RDF030u表示分子体积,Mor17v表示分子的3D结构和大小,G2s属于WHIM描述符,H5m表示分子的大小和原子的性质,RTu+表示化合物结构片段的相关信息;
所述训练集和验证集实验值和预测值的相关系数分别达到0.862和0.614;步骤四、预测未知化合物的皮肤渗透系数,未知化合物经过分子结构的输入和结构优化过程,通过Dragon软件计算7种描述符,分别为上述BEHm8、GGI2、RDF030v、Mor17v、G2s、H5m、RTu+,利用步骤三的预测模型得到未知化合物预测值;
所述方法用于化合物6-氯-N2-乙基-N4-异丙基-1,3,5-三嗪-2,4-二胺、1,1,1-三氯乙烷、O,O-二甲基-O-(2,4,5-三氯苯基)硫逐磷酸酯的皮肤渗透系数的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于环境保护部南京环境科学研究所,未经环境保护部南京环境科学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410676421.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用