[发明专利]一种化学物质P-糖蛋白相互作用QSAR筛选方法在审
申请号: | 202111338187.2 | 申请日: | 2021-11-12 |
公开(公告)号: | CN114171111A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 陈会明;李海山;崔颖;周丽丽 | 申请(专利权)人: | 中检科健(天津)检验检测有限责任公司 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00 |
代理公司: | 天津合正知识产权代理有限公司 12229 | 代理人: | 邢月 |
地址: | 300300 天津市东丽*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 化学物质 糖蛋白 相互作用 qsar 筛选 方法 | ||
本发明提供了一种化学物质P‑糖蛋白相互作用QSAR筛选方法,包括如下步骤:(1)采集数据;(2)将分子描述符的值进行归一化,使每个分子描述符的权重平等;(3)将得到的数据集分为训练集、预测集和外部验证集;(4)对分子描述符根据分子描述符之间的相关系数进行筛选;(5)将MPSO与GA进行嵌套循环,并优化支持向量机的内核参数与最优特征自变量子集后即成。本发明所述的化学物质P‑糖蛋白相互作用QSAR筛选方法将MPSO与GA进行嵌套循环,并确定SVM的最优特征自变量子集和优化内核参数,在此基础上构建定量构效关系模型,对P‑gp底物类和抑制剂类化合物具有较为准确的分类。
技术领域
本发明属于化学领域,尤其是涉及一种化学物质P-糖蛋白相互作用QSAR筛选方法。
背景技术
目前化学物质与P-糖蛋白(P-gp)之间相互作用的试验方法包括体外和体内模型。人或动物原代细胞、组织细胞、肿瘤细胞常用于体外模拟体内环境,如用于模拟人胃肠道功能的人结肠癌细胞系 Caco-2、LS180、T84、LS174T等,用于模拟血-脑脊液屏障通透性的脑微血管内皮细胞系(BMECs)等,以及用于模拟肝脏代谢的原代肝细胞、肝癌细胞等,这些细胞模型同样适用于不同组织器官Pgp的诱导研究。研究P-gp诱导的体内模型以啮齿动物为主,主要有野生型及基因敲除的大鼠和小鼠。实验方法主要有:利用Western blot、荧光定量PCR、免疫组化等手段检测诱导前后不同组织器官(如肠道、肝、肾、血-脑脊液屏障等)P-gp基因和蛋白表达水平变化;以LC-MS /MS、放射性核素检测等方法获得特异性P-gp底物的血药浓度-时间曲线、组织分布、胃肠道吸收等参数,用以表征P-gp外排功能的变化。
上述体内和体外试验存在问题为试验系统复杂,成本高,试验周期较长,同时稳定性不够理想,不能满足高通量筛选的需要。
采用定量构效关系方法对化学物质的P-gp作用进行筛选是现代高通量筛选方法。目前针对与P-gp作用化合物构效关系的研究一般均侧重于区分底物与非底物的区分。抑制剂与底物之间的区分的定量构效关系相关研究少之又少。
基于结构风险最小化原则,支持向量机(SVM)是一个优秀的机器学习方法。与其他的机器学习系统相比,支持向量机有许多有吸引力的特点,包括缺乏局部最小值的情况下,其速度、可伸缩性和包含在训练集中浓缩信息的能力等。然而,利用SVM研究定量构效关系模型时存在两个问题,即最优特征自变量子集和内核参数集合的选择。众所周知,如果支持向量机包括太多的变量,计算复杂性会大大增加,还会使其承受维数灾难和过拟合的风险。相反,一些与生物活性不相关的变量可能导致糟糕的泛化性能和精度不良。因此,最优特征自变量子集的选择是加速计算和改进支持向量机泛化性能所必要的。内核参数,包括点球常数C和核函数中的参数(径向基函数的宽度参数r 等),一定程度上也会影响支持向量机的性能。内核参数集合应该在特征选择的的时候同时被优化,以便充分发挥SVM的性能。达到该目的,最重要的是要为最优特征自变量子集和内核参数集合的选择提供正确解决方案。
遗传算法(GA)可以被用来同时选择SVM的特征自变量子集和优化内核参数该算法并已经广泛与SVM联合应用。但是,它通常具有良好的搜索准确度但是有较差的精密度。虽然遗传算是全局最优的解决方案,但它通常未能找到最优的解决方案。此外,遗传算法的运行速度很慢。粒子群优化算法(PSO)是一种随机算法,可以应用于非线性优化问题。它是Eberhart和Kennedy于1995年从鸟群在天空飞行受到启发,并应用到自然生物的种群的社会群体行为的模拟中由于其算法简单,相比传统的渐进的计算技术收敛更快,吸引了研究人员更多的关注。尽管PSO算法能为许多优化问题快速收敛到最近的最优解,但是,据报道它在某些优化问题上难以达到全局最优的解决方案,而且会被困在局部方案而遭遇未成熟收敛为了避免局部最优,从而提高算法的性能,突变策略被添加到PSO算法中。Zhou等人曾将GA和 SVM结合去优化特征自变量子集和内核函数。结果表明收敛速度太慢,优化的描述符的数量并不理想,GA的结果总不是最优的。他们还尝试将GA-SVM和PSO耦合去优化特征子集和内核函数。结果表明,模型收敛速度非常快,但精度并不理想。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中检科健(天津)检验检测有限责任公司,未经中检科健(天津)检验检测有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111338187.2/2.html,转载请声明来源钻瓜专利网。