[发明专利]基于残差熵和分层双支持向量机的指标预报方法及应用在审
申请号: | 201410805101.6 | 申请日: | 2014-12-23 |
公开(公告)号: | CN104537228A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 刘民;张君海;董明宇;吴澄 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于残差熵和分层双支持向量机的指标预报方法及应用,属于自动控制、信息技术和先进制造领域,其特征在于,针对生产过程指标预测中训练样本数据少的建模难题,提出一种基于残差熵和分层双支持向量机的建模方法,该方法采用外层支持向量机中二次优化问题的KKT条件将模型输入/输出训练数据分为外层和内层支持向量机的训练数据,利用外层训练数据对外层支持向量机进行训练,采用残差熵度量外层建模误差序列中所含信息的确定性程度,当残差熵较大时,利用内层训练数据对内层支持向量机进行训练。该方法可用于预报多类具有小样本特征的指标预报问题,如马蹄焰玻璃窑炉碹顶温度预报、微电子化学机械研磨过程的研磨厚度预报和城市GDP指标预报。 | ||
搜索关键词: | 基于 残差熵 分层 支持 向量 指标 预报 方法 应用 | ||
【主权项】:
基于残差熵和分层双支持向量机的指标预报方法,其特征在于包括以下步骤:该方法采用分层双支持向量机和残差熵建立生产过程指标预报离线模型,其中残差熵用于确定何时建立内层双支持向量机;采用外层双支持向量机中二次优化问题的KKT条件将模型输入/输出新数据分别划分为外层或内层双支持向量机的输入/输出训练数据,利用外层训练数据对外层支持向量机进行训练,采用残差熵度量外层双支持向量机建模误差序列中所含信息的确定性程度,当残差熵较大时,利用内层训练数据对现有的内层双支持向量机进行进一步训练,所述方法是在计算机上依次按以下步骤实现:步骤(1):设置外层和内层支持向量机不敏感带宽度,建模数据长度,残差熵阀值,外层和内层支持向量机高斯核参数,采集初始建模数据,其表示如下:lw:外层双支持向量机建模数据长度ln:内层双支持向量机建模数据长度外层双支持向量机上限不敏感带宽内层双支持向量机上限不敏感带宽外层双支持向量机下限不敏感带宽内层双支持向量机下限不敏感带宽θ:残差熵阀值σw:外层支持向量机高斯核函数参数σn:内层支持向量机高斯核函数参数X:训练数据输入矩阵,每行为一个输入样本向量Y:训练数据输出列向量,每一个元素对应一个样本输出设从程序启动到当前时刻共采集了k组训练数据,则Xi表示第i个输入行向量,Y=[y(k‑lw+1),y(k‑lw+2),…,y(k)]T步骤(2):通过求解下述优化问题A1和A2,建立或修正外层双支持向量机,并求得其KKT条件:A1:A2:所建立的外层双支持向量机预报模型为:C1:与A1,A2相对应的KKT条件分别为:B1:B2:其中,分别是求解A1和A2对应对偶问题的拉格朗日系数;ξ,η为A1和A2对应的松弛因子;步骤(3):通过下列方法计算外层双支持向量机预报模型的误差序列及其残差熵,设当前时刻为k,外层建模数据长度为lw,内层建模数据长度为ln步骤(3.1):采用步骤(2)公式C1求得训练数据集上外层双支持向量机的建模误差序列E:E=Y‑fw(X)其中步骤(3.2):计算E的相关阵R(k),并用以下公式计算残差熵:σe的取值只要保证在预报过程中RE(k)为正值即可,如果RE(k)大于步骤(1)中设置的阀值θ,则程序转向步骤(4),否则程序转向步骤(5)步骤(4):设内层TSVR的数据建模长度为ln,令Ye=[E(k‑ln+1),E(k‑ln+2),…,E(k)],利用Xe,Ye代替步骤(2)中的X,Y,并选用内层核函数系数σn,建立内层双支持向量机,可表示为:C2:步骤(5):采集下一时刻输入向量Xk+1,通过下式预报k+1时刻输出yp(k+1):C3:其中λ为修正因子,再采集k+1时刻的系统输出y(k+1),判断停机条件是否满足,如果满足则停机,否则将预报时域向前推移一步,转向步骤(6)步骤(6):判断新到输入输出数据对(Xk+1,y(k+1))是否满足步骤(2)中的KKT条件B1,B2;当新数据对同时满足B1,B2时,则不须要修正外层双支持向量机,程序直接转向步骤(3);当新数据对满足B1,但违反B2,则程序转向步骤(2),与初始建模不同的是,此时只重新求解A2,保留A1的解,程序再转向步骤(3);当新数据对满足B2,违反B1,则转向步骤(2),重新求解A1,保留A2的解,再转向步骤(3),当新数据对同时违反B1,B2时,求解A1,A2,程序再转向步骤(3) 。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410805101.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用