[发明专利]一种基于模型稳健性的定量结构-活性关系模型构建方法在审
申请号: | 202211121917.8 | 申请日: | 2022-09-15 |
公开(公告)号: | CN115527619A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 王玉昆;王佳音;王长煜;王欣宇 | 申请(专利权)人: | 辽宁科技大学 |
主分类号: | G16C10/00 | 分类号: | G16C10/00;G16C20/30;G16C20/70;G06N3/00;G06N20/10 |
代理公司: | 北京棘龙知识产权代理有限公司 11740 | 代理人: | 周翠兰 |
地址: | 114031 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 稳健 定量 结构 活性 关系 构建 方法 | ||
1.一种基于模型稳健性的定量结构-活性关系模型构建方法,其特征在于:对于选定的肝脏代谢清除率建模数据集,利用支持向量机回归建立QSAR局部模型,通过粒子群优化算法,以局部模型的五折交叉验证系数的倒数取得最小值为优化目标,对建模数据集中的化合物、表征化合物结构参数的分子描述符和模型的超参数进行联合选择,从而建立稳健性强、可靠性好的QSAR局部模型;采用基于模型应用域限制的局部模型一致性建模方法,在各局部模型应用域的限制下将建立的多个局部模型组合成一致性模型,提高模型的预测性能,扩大模型的应用范围。
2.根据权利要求1所述的一种基于模型稳健性的定量结构-活性关系模型构建方法,其特征在于:该方法包括以下具体步骤:
步骤1):选定建立肝脏代谢清除率QSAR模型的化合物集合,用描述符计算软件计算化合物的描述符,构建建模数据集;
步骤2):描述符清洗;
步骤3):建模数据集分割;
步骤4):关键描述符选择;
步骤5):基于模型稳健性的局部模型构建;
步骤6):各局部模型的应用域分析;
步骤7):各局部模型的有效性验证,计算通过有效性验证的各局部模型的覆盖率;
步骤8):一致性模型构建;
步骤9):一致性模型预测性能评估,一致性模型与局部模型和传统全局模型的比分析。
3.根据权利要求2所述的一种基于模型稳健性的定量结构-活性关系模型构建方法,其特征在于:所述步骤5)需要建立多个局部模型,为了获得结构差异化的局部模型,每个局部模型建立前先在建模数据集D1中随机选择80%的数据,构成局部模型的建模数据集D2;通过PSO优化算法,以局部模型的五折交叉验证系数的倒数取得最小值为优化目标,对建模数据、分子描述符和模型超参数的联合选择;根据PSO算法的优化结果在数据集D2中选择优化的数据子集D3opt,并确定SVR模型的超参数,以保证所建立的局部模型能够获得好的稳健性。
4.根据权利要求2所述的一种基于模型稳健性的定量结构-活性关系模型构建方法,其特征在于:所述步骤5)通过粒子群优化算法建立多个优化的局部模型,直至这些局部模型所包含的数据能够覆盖训练数据集D1 95%以上的数据。
5.根据权利要求2所述的一种基于模型稳健性的定量结构-活性关系模型构建方法,其特征在于:所述步骤8)完成一致性模型构建;将步骤(5)构建好的通过有效性验证的局部模型作为一致性模型的子模型,将其并联组合在一起构成一致性模型;对于待预测化合物a,首先根据各局部模型的应用域对a进行应用域判别,判断a落在哪些局部模型的应用域内;如果a落在某个局部模型的应用域内,则认为该局部模型对a的预测结果是可靠的,否则是不可靠的;最后将所有局部模型对a的可靠预测结果进行平均,得到一致性模型对a的最终预测结果;若a不能落在任何一个局部模型的应用域内,则一致性模型不能对该化合物进行可靠预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁科技大学,未经辽宁科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211121917.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可伸缩的装配式高速铁路桥梁及其装配方法
- 下一篇:烧结机组合板路式喷吹装置