[发明专利]一种多级分类对象的分类方法和装置在审

专利信息
申请号: 201910323668.2 申请日: 2019-04-22
公开(公告)号: CN111832589A 公开(公告)日: 2020-10-27
发明(设计)人: 徐文峰 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 张一军;郭晗
地址: 100086 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多级 分类 对象 方法 装置
【说明书】:

发明公开了一种多级分类对象的分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:利用多级分类对象的样本特征数据,通过联合训练方式逐级构建级联分类模型,构建过程:根据第1级子分类器构建1级级联分类模型;2≤K≤N时,将多级分类对象的样本特征数据和K‑1级级联分类模型输出的多级分类对象的K‑1级分类信息共同输入第K级子分类器,以对K‑1级级联分类模型和第K级子分类器联合训练,得到K级级联分类模型;利用最终的N级级联分类模型对多级分类对象的待分类数据分类,得到N级分类信息。该实施方式考虑类间的亲疏性,分类效果好,可避免误差传递,提高分类准确率,整体模型复杂度低,降低模型开发的难度和工作量。

技术领域

本发明涉及计算机技术领域,尤其涉及一种多级分类对象的分类方法和装置。

背景技术

多级分类是指类别本身存在层级的一种多分类问题。多级分类的最大特点是类别间存在明显的亲疏关系,例如,生物分为动物和植物,动物分为脊索动物和无脊索动物,植物又分为苔藓植物、蕨类植物等,其中脊索动物与无脊索动物更加亲近,而与苔藓植物则比较疏远。现有的多级分类方案:方案一是采用常规机器学习模型,例如支持向量机、神经网络、朴素贝叶斯、决策树等,其认为类别间毫无关联,不考虑类别间的亲疏关系;方案二是采用级联模型,先建立各级分类的子分类器,再通过一些技巧将多个子分类器进行融合,例如,先建立1个一级子分类器用来判别动物或植物,再建立两个二级子分类器,分别用来判别是脊索动物或无脊索动物,以及苔藓植物或蕨类植物。

常规机器学习模型采用一刀切的处理方式,假设类别间毫无关联,不考虑类别之间的亲疏性,由于不能充分挖掘类间的隐藏信息,分类效果差强人意;传统级联模型一般采用判别式模型构建子分类器,先要确定一级分类,再用相应分类器确定二级分类,以此类推,其最主要缺点是当各级别分类拥有较多子类且分类层级较深时,往往需要构建数量庞大的子分类器,对模型开发的影响是灾难性的;此外,各级子分类器的误差向下传递,使得模型的累积误差随着分类层级的增加而迅速增长,较深层级的分类准确率较难保证。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

现有技术中,方案一未考虑类间的亲疏性,分类效果差;方案二存在累积误差,分类准确性差,且建模工作量大,模型复杂度高。

发明内容

有鉴于此,本发明实施例提供一种多级分类对象的分类方法和装置,能够考虑类间的亲疏性,分类效果好,并可避免误差传递,提高分类准确率,整体模型复杂度低,降低了模型开发的难度和工作量。

为实现上述目的,根据本发明实施例的一个方面,提供了一种多级分类对象的分类方法。

一种多级分类对象的分类方法,包括:利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。

可选地,在构建每一级级联分类模型之前,利用所述多级分类对象的样本特征数据训练该级的子分类器,其中,在每级只构建一个子分类器。

可选地,训练各级子分类器的步骤,包括:在训练第1级子分类器时,以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入,以所述多级分类对象的1级分类标注信息为训练目标;在训练第K级子分类器时,2≤K≤N,以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入,以所述多级分类对象的第K级分类标注信息为训练目标。

可选地,所述子分类器通过满足产生式、可追加训练和联合训练的模型构建。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910323668.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top