[发明专利]一种基于稀疏最小二乘支持向量机的4‑CBA含量的软测量方法有效
申请号: | 201410580152.3 | 申请日: | 2014-10-25 |
公开(公告)号: | CN104504232B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 刘瑞兰;戎舟;唐超 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G01N31/10 |
代理公司: | 江苏爱信律师事务所32241 | 代理人: | 唐小红 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 最小 支持 向量 cba 含量 测量方法 | ||
技术领域
本发明提出了一种基于稀疏最小二乘支持向量机的4-CBA含量的软测量方法,属于化学工程领域。
背景技术
支持向量机(Support Vector Machine,SVM)是由Vapnik等提出的基于统计学习和结构风险最小化原理的建模方法,该方法在有限样本情况下,同时兼顾算法的经验风险和推广能力,广泛应用于解决模式分类问题和回归建模问题。标准的支持向量机采用求解二次规划问题的求解方法,最终求出包含少量支持向量的模型,但是算法的复杂度随着样本个数的增加而增加。Suykens在标准SVM的目标函数中用误差平方和项取代误差的绝对值项,提出了最小二乘支持向量机(LSSVM)方法,由于采用等式约束,LSSVM采用求解线性方程组的方法求解,但是如果训练样本多,求出的LSSVM模型规模庞大,每个训练样本都是支持向量,不具有标准支持向量机的稀疏性解。针对这一问题,有采用剪枝方法实现对最小二乘支持向量的稀疏,即先求出非稀疏解,得到一系列核系数,删除核系数小的样本,然后对剩下的训练样本重新建模,反复迭代直到满足要求。Gavin C等人提出了一种改进的稀疏化方法,但仍然以剪枝方法为基础,在重新建模时考虑总的训练样本的残差平方,而不是稀疏后保留的训练样本的残差平方和,从而提高模型的推广能力。甘良志等提出通过在特征空间中寻找样本的最大无关组来解决解的稀疏性问题。
最小二乘支持向量机的预测精度与正则化参数和核函数参数的选取有一定的关系,在最小二乘支持向量机的应用中,常用的参数选择方法有经验法,网格搜索法和智能算法如遗传算法和差分进化算法等。经验法通过试凑进行赋值,带有一定的盲目性,而网格搜索法计算量很大,智能算法可以缩短计算时间,但是大多数文献要么采用智能方法进行最小二乘支持向量机的稀疏化,而参数采用经验法选择;要么仅仅采用智能方法进行正则化参数和核参数的优化,根本就不考虑稀疏化问题。
PX氧化是在反应温度为190摄氏度左右,压力为1.258MPa,在钴、锰等催化剂作用下以醋酸为溶剂,用空气中的氧气将PX氧化为TA(对苯二甲酸),TA进一步纯化后得到PTA(精对苯二甲酸)的过程。PX氧化反应主要由四个反应组成,除原料PX和最终产品AT外,还有其它中间产物:AT(对甲基苯甲醛)、PT(对甲基苯甲酸)和4-CBA(对羟基苯甲醛)。其中4-CBA含量是PTA产品中的重要质量指标,4-CBA含量过低,则氧化反应程度加深,副反应加剧,能耗及醋酸、PX单耗增加。4-CBA含量过高,则PTA产品的质量达不到要求。为了节能降耗,并保证PTA的产品纯度,非常必要对4-CBA含量进行实时监控。
4-CBA含量无法用常规的传感器在线测量,而是通过实验室分析化验出来,化验时间比较长;同时由于化验成本较高,其采样间隔较长,比如某工厂对4-CBA含量的采样周期为8小时,每天固定在0点,8点和16点采样,因此一天最多只有三个滞后数小时的4-CBA含量的分析值。需要采用软测量技术在线估计4-CBA含量。
发明内容
技术问题:本发明的目的是提供一种基于稀疏化最小二乘支持向量机的4-CBA含量的软测量方法,该方法可以实现最小二乘支持向量机的稀疏化和参数优化,获得高效的4-CBA含量软测量模型。
技术方案:本方案包括如下步骤
(1)选择PX氧化过程中的氧化反应器物料进料流量,催化剂浓度,氧化反应器液位,氧化反应器温度,氧化反应器尾氧含量,第三冷凝器排出水量,第一结晶器温度,第一结晶器尾氧含量,反应生成的CO2含量,反应生成的CO含量共10个过程变量作为软测量模型的输入变量。输出量为4-CBA的含量。采集N组输入变量所对应的历史运行数据和4-CBA的含量的分析数据作为初始训练样本。
(2)给每个初始的训练样本提供一个需要优化的概率变量,该变量的取值区间为[0,1],概率变量总个数为初始训练样本的总个数N。
(3)对N个概率变量和最小二乘支持向量机中的参数采用实数编码方法进行编码:对于概率变量在区间[0,1]内随机选取一个值,对于最小二乘支持向量机的参数在区间[0.01,1000]内随机取值。
(4)对N个概率变量的值与O.5进行比较,如果某个概率小于0.5,则对应的样本作为测试样本,概率大于或等于0.5的样本作为保留的训练样本。
(5)定义包括稀疏率、保留的训练样本误差及测试误差在内的适应度函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410580152.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:患者用药核对方法及系统
- 下一篇:基于目标视角的知识网络展现方法和系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用