[发明专利]一种基于模型自适应选择的多分类模型融合方法在审

专利信息
申请号: 201810876135.2 申请日: 2018-08-03
公开(公告)号: CN109086825A 公开(公告)日: 2018-12-25
发明(设计)人: 高欣;刁新平;何杨;井潇 申请(专利权)人: 北京邮电大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基分类模型 样本 融合 自适应选择 分类模型 多分类模型 分类准确率 分类标签 分类结果 准确率 输出形式 数据样本 样本设置 有效融合 结合基 数据集 概率 标签 输出
【权利要求书】:

1.一种基于模型自适应选择的多分类模型融合方法,其特征在于,所述方法步骤包括:

(1)分别计算基分类模型对每一类样本的分类准确率,对结果输出为概率值的分类模型,取其分类结果的Top-N分类标签集;

(2)根据各基分类模型对每类样本的分类准确率最大值,设置各类样本的动态准确率阈值,并对各数据集样本设置分类结果融合标记;

(3)根据样本的融合标记,对每一个样本自适应选择参与融合的基分类模型,结合基分类模型的Top-N分类标签集,实现基分类模型融合。

2.根据权利要求1所述的方法,其特征在于,分别计算基分类模型对每一类样本的分类准确率,对于结果输出为概率值的分类模型,取其分类结果的Top-N分类标签集,具体说明如下:基分类模型个数为2,样本类别数为M,训练集样本数量为n,x为样本特征向量集,x=[x1 x2 … xn],xi表示第i个样本的特征向量,i=1,2,…,n,第k个基分类模型学习到的模型为fk(x);若分类模型k的输出结果为样本属于各类别的后验概率,则fk(xi)表示模型对第i个样本分类结果中概率的最大值对应的样本类别标签,即其Top-1分类标签;若分类模型k的输出为样本的预测类标签,则fk(xi)表示分类模型k对第i个样本的分类标签;ak,j表示第k个基分类模型的输出结果中,分类标签为第j类的样本预测准确率;用于计算基分类模型对于每一类样本的分类准确率的表达式为

其中,I为指示函数,I(j=fk(xi),yi=fk(xi))表示当j=fk(xi)且yi=fk(xi)成立时值为1,否则为0,用于判断样本是否被正确分类。

3.根据权利要求1所述的方法,其特征在于,根据基分类模型对每一个样本类的分类准确率,分别设置各类样本的动态准确率阈值,并对各数据集样本设置分类结果融合标记,具体说明如下:根据基分类模型分类结果对各类别的准确率,计算各类样本准确率阈值σj

σj=λ·max(a1,j,a2,j),j=1,2,…,M

其中,σj表示第j类样本的准确率阈值,λ为阈值系数,且满足λ∈[0,1];

对分类模型预测结果中的各类别样本分别设置融合标记δj

其中,δj表示第j类样本的融合标记;δj=1表示分类标签为第j类的样本,分类模型1的准确率明显高于分类模型2,其模型融合后的分类结果取分类模型1的分类结果;δj=2表示预测为第j类的样本模型融合后输出结果取分类模型2的分类结果;δj=0表示对于预测结果标签为第j类的样本,基分类模型之间的分类准确率没有明显差别,需要将基分类模型的结果进一步判断以确定最终模型融合后的输出;

结合基分类模型的分类结果及其结果中各类样本的融合标记,进而可得数据集各个样本的融合标记εi

εi=δj

s.t.f1(xi)=j

其中,εi表示第i个样本的融合标记,δj表示第j类样本的融合标记,f1(xi)为基分类模型1对第i个样本的分类结果,且有i=1,2,…,n,j=1,2,…,M;

即得数据集各样本的模型融合标记Θ:

Θ=[ε1 ε2 … εi … εn]。

4.根据权利要求1所述的方法,其特征在于,根据各基分类模型对每类样本的分类准确率最大值,设置各类样本的动态准确率阈值,并对各数据集样本设置分类结果融合标记,具体说明为:假定分类模型1的输出结果为将样本分为各样本类的概率,由分类模型1输出的样本分别属于各类的概率大小,得分类模型1对该样本的分类结果中后验概率较大的前N个分类标签集合Top-N;假定表示第k个分类模型输出的第i个样本的Top-N集合中,按后验概率由大到小的第j个分类标签,则有:

其中,n为数据集样本数量;

假定分类模型2学习到的模型为f2(x),其学习结果中对各样本的分类标签为f2(xi);得分类模型2对数据集的分类结果F2(x)为:

F2(x)=[f2(x1) f2(x2) … f2(xi) … f2(xn)]

假定分类模型融合后,样本的分类结果输出为p(xi),由样本的融合标记可得:

其中,f1(xi)=f11(xi),表示分类模型1结果中特征样本xi所属类别后验概率最大值所对应的类别标签;pf(xi)表示融合标记εi=0的样本融合后的输出标签:

s.t.εi=0,i=1,2,…,n

其中,Top-Ni表示特征样本xi对应的Top-N集合中的分类标签集:

Top-Ni=[f11(xi) f12(xi) … f1j(xi) … f1N(xi)]

可得数据集样本在基分类模型学习后,利用基于Top-N分类标签集的模型融合方法融合之后,可以确定最终输出的分类标签P(x):

P(x)=[p(x1) p(x2) … p(xi) … p(xn)]。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810876135.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top