[发明专利]定量结构活性关系预测有机化学品鱼类生物富集因子有效
申请号: | 201410013562.X | 申请日: | 2014-01-10 |
公开(公告)号: | CN103761431B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 乔显亮;郑玉婷;李雪花;陈景文;杨先海 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 李宝元,梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的采用定量结构活性关系预测有机化学品的鱼类生物富集因子,属于生态风险评价测试策略领域。从公开的数据库或已发表论文中搜集了780种有机化合物的生物富集因子数据,采用密度泛函理论对有机化合物的分子结构进行优化,基于优化后的分子结构,从780种有机化合物的4885种分子描述符中初步筛选得到3480个描述符;将有机化合物按照41的比例分成训练集和验证集,训练集用于构建预测模型,验证集用于建模后的外部验证。模型应用域明确,涵盖新兴污染物,具有良好的拟合效果、稳健性和预测能力,能够有效预测多种类不同有机化合物的生物富集因子,为有机化学品风险评价和管理提供重要数据支持,对生态风险评价具有重要意义。 | ||
搜索关键词: | 定量 结构 活性 关系 预测 有机 化学品 鱼类 生物 富集 因子 | ||
【主权项】:
一种采用定量结构活性关系预测有机化学品的鱼类生物富集因子的方法,其特征在于,搜集780种有机化合物的生物富集因子数据,采用密度泛函理论对780种有机化合物的分子结构进行优化,基于优化后的分子结构,从780种有机化合物的4885种分子描述符中初步筛选得到3480个描述符;其中初步筛选是去掉常数和近似常数的描述符,去掉至少有一个缺失值的描述符;所述的有机化合物包括多氯联苯、多溴联苯、全氟烷基酸、二恶英类、双酚A、农药;然后将上述的780种有机化合物按照4:1的比例分成训练集和验证集,训练集用于构建预测模型,验证集用于建模后的外部验证;采用逐步回归方法构建多元线性回归模型,该模型如下:logBCF=2.137+0.061×MLOGP2+0.034×F02[C‑Cl]‑0.312×nROH‑1.282×P‑117+0.323×Mor25m‑0.052×N%+0.080×X4v‑0.289×O–058‑1.137×LLS_01‑1.387×H4v+0.071×SM12_AEA(dm)‑0.269×O‑057其中,logBCF代表生物富集因子的对数,MLOGP2代表logKOW的平方,F02[C‑Cl]代表原子对C和Cl拓扑距离为2时出现的频率,nROH代表羟基的个数,P‑117代表分子中“X3‑P=X”结构的数量,Mor25m代表加权质量计算出的散射函数值,N%代表N原子的百分比,X4v是四价连接性指数,O‑058代表分子中“=O”结构的数量,LLS_01是一个类药指数,H4v代表氢加权范德华体积滞后4的自相关函数值,SM12_AEA(dm)代表加权偶极矩的12谱距增广边缘邻接矩阵值,O‑057代表酚、醇分子中“OH”的数量;特征向量欧几里德距离不大于1.438的化合物适用于本模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410013562.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种耐受温度范围较广的鞋底
- 下一篇:刀片式铣刀
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用