[发明专利]表面活性剂的构效关系研究方法和装置在审
申请号: | 202010278373.0 | 申请日: | 2020-04-10 |
公开(公告)号: | CN113517035A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 刘友权;唐永帆;熊颖;吴文刚;张燕;原励;杜国滨;石晓松 | 申请(专利权)人: | 中国石油天然气股份有限公司 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 董亚军 |
地址: | 100007 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表面活性剂 关系 研究 方法 装置 | ||
本申请公开了一种表面活性剂的构效关系研究方法和装置,属于分子构效关系研究技术领域。本申请实施例提供的表面活性剂的构效关系研究方法,通过将多个第一特征变量进行共线性聚类,避免了特征变量之间的共线性导致特征变量冗余的问题,且对第二特征变量进行非线性主成分分析压缩,避免了特征变量数量过多导致的过拟合的问题,从而提高了预测模型预测的准确性。
技术领域
本申请涉及分子构效关系研究技术领域。特别涉及一种表面活性剂的构效关系研究方法和装置。
背景技术
表面活性剂在水中形成胶束所需的最低浓度称为临界胶束浓度(criticalmicelle concentration,简称cmc)。cmc可作为表面活性剂表面活性的一种度量,cmc越小,表明这种表面活性剂形成胶束所需的浓度越低,达到表面饱和吸附的浓度越低,表面活性越高。而表面活性剂的结构与cmc之间的构效关系对表面活性剂的研究有着极其重要的参考价值,尤其是对咪唑鎓盐类双子表面活性剂的构效关系的研究。
相关技术中,主要是先计算咪唑鎓盐类双子表面活性剂的每个特征变量的方差值,根据该方差值的大小从中筛选多个最优特征变量,剔除非重要的特征变量,通过筛选后的多个最优特征变量构建预测模型,最终根据该预测模型预测咪唑鎓盐类双子表面活性剂的cmc。
但相关技术中在筛选多个最优特征变量时,仅剔除了非重要的特征变量,特征变量之间还存在共线性关系,存在冗余变量,导致预测模型无法准确预测咪唑鎓盐类双子表面活性剂的cmc,预测的准确性低。
发明内容
本申请实施例提供了一种表面活性剂的构效关系研究方法和装置,可以提高预测模型预测的准确性。具体技术方案如下:
一方面,本申请实施例提供了一种表面活性剂的构效关系研究方法,所述方法包括:
获取多个样本表面活性剂的临界胶束浓度cmc,以及获取所述多个样本表面活性剂的多个第一特征变量,每个样本表面活性剂均具有多个第一特征变量,所述样本表面活性剂为咪唑鎓盐类双子表面活性剂;
对于每个样本表面活性剂,将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量;
对所述多个第二特征变量进行非线性主成分分析压缩,得到多个第一主成分变量,从所述多个第一主成分变量中提取第一数量个第一主成分变量;
根据每个样本表面活性剂的cmc、所述每个样本表面活性剂对应的第一数量个第一主成分变量和多元线性回归方程进行模型训练,得到预测模型;
当对待预测的目标表面活性剂的cmc进行预测时,获取所述目标表面活性剂的第一数量个第二主成分变量,所述目标表面活性剂为咪唑鎓盐类双子表面活性剂;
将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc。
在一种可能的实现方式中,所述将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量,包括:
确定每两个第一特征变量之间的线性相关系数;
将所述线性相关系数不小于预设阈值的第一特征变量聚为一类,得到多个分类,每个分类中包括至少两个第一特征变量,且每个分类中任意两个第一特征变量之间的线性相关系数不小于所述预设阈值;
对每个分类中的每个第一特征变量进行特征评分;
从所述每个分类中选择特征评分最高的第一特征变量,将特征评分最高的第一特征变量作为第二特征变量,得到多个第二特征变量。
在另一种可能的实现方式中,所述确定每两个第一特征变量之间的线性相关系数,包括:
获取每个第一特征变量的特征值以及所述多个样本表面活性剂和测试表面活性剂的总数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油天然气股份有限公司,未经中国石油天然气股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010278373.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于数字化现金的线上交易方法及装置
- 下一篇:一种天线测试设备