[发明专利]一种基于粒子群优化的最小二乘支持向量机组合预测方法无效
申请号: | 201210504955.1 | 申请日: | 2012-11-30 |
公开(公告)号: | CN103020434A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 李爱;陈果;王洪伟;程小勇;郝腾飞;于明月 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于粒子群优化的最小二乘支持向量机组合预测方法,根据要预测的数据特征选择合适的单项预测模型,将不同的预测方法进行适当的组合,充分利用各单项预测模型所包含的有用信息,建立最小二乘支持向量机LSSVM回归模型,利用粒子群优化算法PSO优化影响LSSVM回归模型精度的2个核心参数包括核函数参数g以及LSSVM中正则化参数C,得到最佳的LSSVM回归模型;从而达到提高预测精度、降低预测风险的目的,极大提高了算法的收敛速度,更加符合实际工程需要。 | ||
搜索关键词: | 一种 基于 粒子 优化 最小 支持 向量 机组 预测 方法 | ||
【主权项】:
1.一种基于粒子群优化的最小二乘支持向量机组合预测方法,其特征在于,所述方法包括如下步骤:步骤A,根据数据特征选择合适的单项模型,步骤为:步骤A-1,确定训练集和测试集,对于预测数据给定时间序列的实际测试值,将它们分为训练集Tr和测试集Te,yTri和nTr分别代表训练集Tr的实际值和样本量;yTei和nTe分别代表测试集的实际值和样本量;步骤A-2,数据预处理,采用级差标准化对训练集Tr和测试集Te的实测数据进行标准化处理,标准化后的数值在[0,1]范围内;步骤A-3,训练集Tr建模,利用训练集Tr中的yTri作为样本完成单一模型建模,得到AR模型、GM(1,1)模型和BP神经网络模型的参数;对于AR模型的阶数,利用AIC准则与FPE准则,不同的模型阶数p,计算出不同的AIC值与FPE值,取平均值,最小值时的p就是适用模型的阶数,相应的模型即为最佳适用模型;并将该AR模型的阶数值作为BP神经网络模型的嵌入维数,BP神经网络模型的隐层神经元数目由经验公式给出:nH=(nI+nO)1/2+l,其中nH为隐含层神经元数目,nI为输入层神经元数目,nO为输出层神经元数目,l取值为1到10的整数;步骤B,通过单项预测方法得到初步预测结论作为最小二乘支持向量机LSSVM组合预测样本,根据支持向量机回归原理,建立LSSVM回归模型;分别对AR模型、GM(1,1)模型和BP神经网络模型输入对应的参数,得到训练集中数据yTri的拟合值形成训练样本,利用得到的训练样本,训练生成LSSVM模型:f ( x ) = Σ i = 1 l α i K ( x , x i ) + b ]]> 其中,高斯径向基核函数K(xi,xj)=exp(-g||xi-xj||2);αi为Lagrange因子,αi∈R;b为常值偏差;步骤C,利用粒子群优化算法PSO优化影响LSSVM回归模型精度的2个核心参数包括核函数参数g以及LSSVM中正则化参数C,得到最佳的LSSVM回归模型;将g和C分别作为粒子的x轴坐标和y轴坐标,群体规模设为M,最大迭代次数为hmax,C∈[1,10000],g∈[0,1]并按以下步骤:步骤C-1,初始化粒子群,随机设置粒子的初始位置x和速度v;步骤C-2,计算每个粒子的适应度值fitness,在每个粒子位置,运用训练样本数据训练得到LSSVM回归模型,并用训练好的模型计算得到测试样本的预测值,并将测试样本的真实值与预测值的平均绝对误差作为粒子的适应度值;步骤C-3,对所有的i∈{1,2,…,M},如果fitnessi>Pbesti,则令Pbesti=fitnessi,如果fitnessi>gbest,则重新设置gbest的索引号a;其中,Pbesti为第i个粒子曾经达到的最大适应度值,为粒子曾经到达的最大适应度值时对应的位置,gbest为在群体所有粒子经历过的最好位置;步骤C-4,每一个粒子的位置xi和速度vi分别为:v i = wv i + c 1 r 1 ( x i Pbest - x i ) + c 2 r 2 ( x i gbest - x i ) ]]> xi=xi+vi其中,r1,r2为[0,1]之间的随机数,c1,c2为加速度系数,c1+c2≥4,w为惯性权值;步骤C-5,检查停止条件,如果达到最大迭代次数hmax则停止迭代;否则,返回步骤C-2;步骤C-6,根据得到的最优参数g和C,建立LSSVM回归模型;步骤D,利用已建立的单项模型分别进行外推预测,得到待预测数据的预测值输入到LSSVM模型中,得到数据在预测时间点的预测值求出各模型的外推误差ETe、拟合误差ETr和外推误差之和Es:E Tr = 1 n Tr Σ i = 1 n Tr | y ^ Tri - y Tri | y Tri × 100 % ; ]]>E Te = 1 n Te Σ i = 1 n Te | y ^ Tei - y Tei | y Tei × 100 % , ]]> Es=ETr+ETe。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210504955.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用