[发明专利]一种基于模型自适应选择的多分类模型融合方法在审
申请号: | 201810876135.2 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109086825A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 高欣;刁新平;何杨;井潇 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基分类模型 样本 融合 自适应选择 分类模型 多分类模型 分类准确率 分类标签 分类结果 准确率 输出形式 数据样本 样本设置 有效融合 结合基 数据集 概率 标签 输出 | ||
本发明实施例提出了一种基于模型自适应选择的多分类模型融合方法,包括:分别计算基分类模型对每一类样本的分类准确率,对结果输出为概率值的分类模型,取其分类结果的Top‑N分类标签集;根据各基分类模型对每类样本的分类准确率最大值,设置各类样本的动态准确率阈值,并对各数据集样本设置分类结果融合标记;根据样本的融合标记,对每一个样本自适应选择参与融合的基分类模型,结合基分类模型的Top‑N分类标签集,实现基分类模型融合。本发明实施例提供的技术方案,可以将结果输出形式分别为概率值和样本所属类标签的两个基分类模型进行有效融合,能针对每一个数据样本实现基分类模型的自适应选择,提高融合之后分类模型的准确率。
【技术领域】
本发明涉及机器学习领域解决多分类问题时的分类模型融合方法,尤其涉及一种两个基分类模型输出形式分别为概率值和类别标签的多分类模型融合方法。
【背景技术】
在将多个分类模型融合以解决多分类问题时,需要综合基分类模型的学习结果来决定融合后分类模型的输出。利用数据挖掘技术解决多分类问题,综合多个基分类模型的学习结果实现信息互补以进一步提升分类模型的性能,是当今研究的热点之一。目前在对基分类模型结果进行融合时,常用的模型融合方法主要包括最值法、求和法、均值法、投票法,考虑到不同分类模型的决策性能不同,通常在对基分类模型结果进行融合时会对不同的分类模型结果设置权值,从而更好的保证融合后分类模型性能的提升。最值法、求和法和均值法在进行模型融合时,其要求基分类模型的结果输出形式必须是数据样本属于每一样本类别的概率值,而对于输出结果为样本类别标签的基分类模型并不适用;在利用投票法进行模型融合时,其对基分类模型的结果输出形式没有限制,但是其少数服从多数的决策机制决定了其只能适用于基分类模型个数不少于三个的情况。考虑到现有的模型融合方法对基分类模型结果输出形式及基分类模型个数的限制,对于两个基分类模型的输出分别为概率值和样本标签的情况,现有的模型融合方法并不能有效适用。当分类模型输出结果为将样本属于各类别的概率时,可以通过比较分类模型将样本分为各类的概率大小,获取该分类模型对该样本的前N个分类标签,以下简称为Top-N分类标签集。
【发明内容】
有鉴于此,本发明实施例提出了一种基于模型自适应选择的多分类模型融合方法,可以解决现有融合算法对基分类模型的限制,并针对每一个数据样本实现对基分类模型的自适应选择。
本发明实施例提出的一种基于模型自适应选择的多分类模型融合方法,包括:
分别计算基分类模型对于每一类样本的分类准确率,对结果输出为概率值的分类模型,取其分类结果的Top-N分类标签集;
根据各基分类模型对每类样本的分类准确率最大值,设置各类样本的动态准确率阈值,并对各数据集样本设置分类结果融合标记;
根据样本的融合标记,对每一个样本自适应选择参与融合的基分类模型,结合基分类模型的Top-N分类标签集,实现基分类模型融合。
上所述方法中,分别计算基分类模型对每一类样本的分类准确率,对于结果输出为概率值的分类模型,取其分类结果的Top-N分类标签集的方法为:基分类模型个数为2,样本类别数为M,训练集样本数量为n,x为样本特征向量集,x=[x1 x2 … xn],xi表示第i个样本的特征向量,i=1,2,…,n,第k个基分类模型学习到的模型为fk(x);若分类模型k的输出结果为样本属于各类别的后验概率,则fk(xi)表示模型对第i个样本分类结果中概率的最大值对应的样本类别标签,即其Top-1分类标签;若分类模型k的输出为样本的预测类标签,则fk(xi)表示分类模型k对第i个样本的分类标签。ak,j表示第k个基分类模型的输出结果中,分类标签为第j类的样本预测准确率。用于计算基分类模型对于每一类样本的分类准确率的表达式为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810876135.2/2.html,转载请声明来源钻瓜专利网。