[发明专利]一种基于树型编码和进化优化的混合函数拟合方法在审

专利信息
申请号: 202010021584.6 申请日: 2020-01-09
公开(公告)号: CN112348150A 公开(公告)日: 2021-02-09
发明(设计)人: 陈皓;郭紫园;段红柏 申请(专利权)人: 西安邮电大学
主分类号: G06N3/00 分类号: G06N3/00;G06N20/00;G06F16/22;G06F16/2458
代理公司: 暂无信息 代理人: 暂无信息
地址: 710121 陕西*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 编码 进化 优化 混合 函数 拟合 方法
【权利要求书】:

1.一种基于树型编码和进化优化的混合函数拟合方法,所述方法包括以下步骤:

步骤1:数据准备与混合拟合函数,具体为:

步骤1.1:数据准备,数据集S结构可表示为

S={Xi,Yi},i=1,2,...,N,

Xi=[x1,x2,...,xd],

其中,Xi为数据集S中的第i个样本点的输入,Yi为S中的第i个样本点的输出,d为Xi的维度,N为样本点的个数;

步骤1.2:混合函数拟合模型设计,混合模型ψ的定义为

其中,wk是第k个子模型的乘数因子,gk(.)是第k个子模型的结构,gk(.)的可选模型类型包含有指数模型、对数模型、高斯模型和幂模型;

步骤2:混合函数拟合模型的树型编码表达,具体为:

针对此种混合模型,采用一种改进的树型(Improved expression tree,I-ET)编码表达机制;在该机制中,一个节点由两部分组成:乘数因子部分和结构部分,也即模型中的每个节点Node的结构部分sp都会关联一个乘数因子mp,其中mp为随机产生的常数,sp可从不同类型的节点集合中进行选择;不同类型的节点集合有函数集F={F1,F2,...,Fm}和端点集T={x1,x2,...,xd,c},其中T是输入变量和常量c的集合,F是一些函数运算符的集合,集合中的元素代表gk(.)可选类型,比如F可设置为F={+,-,*,exp,ln,power};实际上混合模型ψ中的gk(.)是由mp和sp组成的若干个节点经过有限次复合构成的子树;但高斯模型比较特殊,是由T中的Xi以一定概率产生;

对树型结构进行解码可得到混合模型的表达式,解码采用中序遍历方式实现;具体的解码过程如下:首先获取当前节点,若当前节点有两个子树,首先遍历左子树,然后访问当前节点的sp,最后遍历右子树;若当前节点仅有一个子树,则先访问当前节点的sp,再遍历左子树;直至子树为空则结束;当前节点的mp乘以遍历子树后的结果即为当前的模型表达式;

步骤3:模型的优化过程;具体为:

步骤3.1:初始化种群,种群由NP个随机生成的I-ET编码的模型构成,表示为pop={ψ12,...,ψNP},j=1,2,...,NP;ψj的构造过程如下:若当前节点的深度小于D,则从F∪T中随机选取一个元素,否则就从T中随机选取,选取的元素作为当前节点的sp并关联一个随机产生的mp;当选取的元素属于T中的Xi时,将以概率Pgs设置为关于Xi的高斯节点,并且添加高斯节点所需的均值和方差属性;如此重复执行上述过程,形成一个完整的模型;其中NP为种群规模,D为模型的最大深度,F为函数集,T为端点集,置迭代数值gen=0;

步骤3.2:搜索运算,在进化过程中模型的搜索主要依靠交叉和变异算子实现,按照概率Pc,Pm选择本次搜索为交叉或变异操作,并转到对应的步骤,具体为:

步骤3.2.1:交叉算子,设置交叉运算符为则交叉运算可定义为其中ψ1和ψ2为从种群中随机选择的两个父代模型,o1和o2为交叉产生的两个子代模型;具体的交叉过程为首先分别随机选取ψ1和ψ2的交叉点,根据2种不同的交叉策略执行交叉操作;交叉策略1为将交叉点的sp与mp作为一个整体,直接交换两个父代中以交叉点为根节点的子树;交叉策略2为首先将两个交叉点的mp进行互换,再交换以交叉点为根节点的子模型,也即mp不随着sp进行交换;交叉策略1旨在搜索模型中不同子模型的组合,交叉策略2不仅搜索不同子模型的组合,也搜索了不同子模型的乘数因子,以防止节点的乘数因子在初始化模型后不再发生改变;根据概率Pcs将2种不同的交叉策略进行有效结合,不仅对模型的组合进行搜索,还对模型的参数进行搜索;

步骤3.2.2:变异算子,设置变异运算符为⊙,则变异运算可定义o=⊙(ψ),其中ψ为从种群中随机选择的父代模型,o为变异产生的子代模型;具体的变异过程为首先随机选取ψ的变异点,由于高斯节点的特殊性,将根据是否为高斯节点采取不同的变异策略执行变异操作;当变异点为非高斯节点时,则删除以该变异点为根节点的子模型,在该变异点处插入一个新的随机生成的子模型;当变异点为高斯节点时,根据概率Pms选择将整个高斯节点进行变异,即对高斯节点的均值和方差属性以及乘数因子部分都进行变异,也可随机选择对该高斯节点的乘数因子部分或者均值或者方差属性进行变异;

步骤3.3:模型评估及选择阶段,具体为:

步骤3.3.1:模型评估,模型评估从误差ferror和复杂度fnode两方面进行考虑,ferror采用平均绝对误差进行量化,fnode采用对模型ψ进行I-ET编码后的节点数量进行量化,模型误差ferror和复杂度fnode的计算公式如下

fnode=Tnode

其中,是训练集中第i个输入样本点关于模型ψ的对应输出,yi是训练集第i个样本的观测值,n是训练集中样本的个数,Tnode是对模型ψ进行I-ET编码后的节点数量;

步骤3.3.2:模型选择,经搜索产生的子代个体o与其父代个体ψ进行一对一竞争,获胜的个体将遗传到下一代种群popgen+1,失败的个体将淘汰;当满足以下条件

ferror(o)≤ferror(ψ),

fnode(o)≤fnode(ψ),

则认为o优胜于ψ;但以上条件会出现无法判断两个个体的优劣情况,如o的误差小于ψ,但ψ的复杂度小于o,此时则需要根据适应度确定个体优劣情况,适应度比较方式如下

其中,ψgen+1为o和ψ中适应度较小的个体,并加入到下一代种群popgen+1中,适应度fit的计算公式如下

其中,α为调节两个目标的占比,经实验发现α取0.7时,模型的误差ferror和复杂度fnode都相对较优;和为归一化后的值,归一化公式如下

其中,ferror(ψ)为ψ的误差,fnode(ψ)为ψ的复杂度,和分别为当前种群中ferror的最小值和最大值,和分别为当前种群中fnode的最小值和最大值;

步骤3.4:若下一代种群popgen+1中的个体数量小于NP,转步骤3.2,否则转步骤3.5;

步骤3.5:更新全局最优模型,若全局最优模型pbest为空时,则否则在pbest和中根据步骤3.3选择获胜的个体更新全局最优模型;为种群popgen+1中获得最小适应度的个体,置gen=gen+1;

步骤3.6:判断当前迭代次数gen是否满足最大迭代次数NG,若满足则输出全局最优模型pbest进行数据预测,否则转步骤3.2。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010021584.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top