[发明专利]用于预测化合物活性的两级拟合QSAR模型的构建方法有效
申请号: | 201210455239.9 | 申请日: | 2012-11-14 |
公开(公告)号: | CN102930113A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 刘雅红;贺利民;梁智斌;方炳虎;陈建新;汤有志;陈良柱 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N3/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 杨晓松 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 化合物 活性 两级 拟合 qsar 模型 构建 方法 | ||
技术领域
本发明涉及一种OSAR模型的构建方法,尤其是一种用于预测化合物活性的两级拟合QSAR模型的构建方法,属于生物医药信息技术领域。
背景技术
定量构效关系(Quantitative Structure-Activity Relationship,简称QSAR)是一种借助数学模型定量预测化合物活性的技术。由于3D QSAR的研究结果具有明确的指导意义,目前已被许多研究广泛采用。但由于3D QSAR的建模过程在商业软件的黑箱中执行,而软件黑箱中的过程又难以人为干预,这无疑增大了其建模优化的难度,至今尚未有一种公开发表、公认方便快捷3D QSAR的建模方法。因此,建立一种方便快捷的3D QSAR建模方法具有重要意义。
目前,在刊物上记载的3D QSAR方法在建模过程中,不仅化合物叠合不整齐,而且运用传统的线性回归方法(如偏最小二乘法等),在拟合模型的过程中仅考虑有机化学理论、不考虑生物受体的复杂性,导致不符合生物化学理论、影响最终的拟合优度和预测能力。
基于最短距离的Topomer叠合技术具有整齐的叠合结果,是一种具有乐观应用前景的化合物叠合方法。如果能考虑生物受体的复杂性,使得基于Topomer叠合方法的QSAR研究结果符合生物化学理论,则可提高QSAR模型的拟合优度和预测能力。
神经网络(Neural Networks)是一种通过模拟哺乳动物大脑的生理功能进行数据拟合的统计建模方法。神经网络模型已经成功地应用于生物大分子的功能预测、有机污染物的毒性预测、高分子聚合材料的性能预测等,在化学药物分子设计中的应用也将日益广泛。由于神经网络逼近任意复杂的映射关系,因此当化合物的作用靶标为比小分子更加复杂的生物受体大分子时,基于神经网络的QSAR模型能比线性模型更准确地预测化合物的生物活性。
基于神经网络的QSAR建模一般需要通过如下三个步骤:1)整理化合物的活性数据作为因变量;2)挑选合适的描述符作为自变量并计算;3)选用合适的神经网络方法构建QSAR模型。
其中,挑选合适的描述符作为自变量是建立具有良好预测能力的神经网络QSAR模型的必要条件。若自变量蕴含的信息增益不足,则所建模型难以具有良好的预测能力,然而增加自变量的数目虽然有可能提高信息增益,但会出现过拟合、不收敛现象而导致模型性能下降、甚至建模失败。因此,寻找一种包含足够信息增益的低维向量作为自变量,对于构建基于神经网络的QSAR模型非常关键。
发明内容
本发明的目的,是为了解决上述现有技术的缺陷,提供一种具有良好拟合优度、准确预测化合物生物活性的用于预测化合物活性的两级拟合QSAR模型的构建方法。
本发明的目的可以通过采取如下技术方案达到:
用于预测化合物活性的两级拟合QSAR模型的构建方法,其特征在于包括以下步骤:
1)取若干个具有相同骨架的化合物作为训练集,将训练集化合物划分取代基,并叠合训练集化合物;
2)根据训练集化合物的结构与活性,采用线性回归法计算各取代基产生的局部生理作用,建立前级拟合模型;
3)根据训练集化合物的活性与步骤2)计算得到的局部生理作用,采用神经网络法计算出化合物的整体生物活性,建立后级拟合模型;
4)将前级拟合模型和后级拟合模型结合,构建成前后两级QSAR模型。
作为一种优选方案,步骤2)所述训练集化合物的活性为抑制浓度或抑制率。
作为一种优选方案,步骤1)具体如下:
对于已有的化合物,针对特定检验体系进行生物学活性的数据采集,数据指标采用抑制浓度或抑制率的负对数形式[-lg(抑制浓度)或-lg(1/抑制率-1)],以此作为训练集样本;使用Sybyl分析软件检验化合物的二维结构,对通过检验的化合物生成其三维结构;随后,进一步划分化合物的取代基,并进行优化;最后,基于取代基划分,并采用Topomer叠合技术对以上化合物三维结构进行叠合。
作为一种优选方案,步骤2)具体如下:
用探针扫描叠合的训练集化合物周围的分子场,计算MSA、CoMFA或者CoMSIA分子场,对分子场信息进行挑选后,与训练集化合物的实验活性进行线性回归,获得构效关系的前级拟合模型。
作为一种优选方案,步骤3)具体如下:
将步骤2)计算得到的局部生理作用,与训练集化合物的活性进行归一化,得到归一化值,通过神经网络模型去归一化,计算出化合物的整体生物活性,获得后级拟合模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210455239.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手动四工位换刀结构
- 下一篇:一种糯小麦烘烤食品及其制作方法