[发明专利]一种多级分类对象的分类方法和装置在审
申请号: | 201910323668.2 | 申请日: | 2019-04-22 |
公开(公告)号: | CN111832589A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 徐文峰 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;郭晗 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多级 分类 对象 方法 装置 | ||
本发明公开了一种多级分类对象的分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:利用多级分类对象的样本特征数据,通过联合训练方式逐级构建级联分类模型,构建过程:根据第1级子分类器构建1级级联分类模型;2≤K≤N时,将多级分类对象的样本特征数据和K‑1级级联分类模型输出的多级分类对象的K‑1级分类信息共同输入第K级子分类器,以对K‑1级级联分类模型和第K级子分类器联合训练,得到K级级联分类模型;利用最终的N级级联分类模型对多级分类对象的待分类数据分类,得到N级分类信息。该实施方式考虑类间的亲疏性,分类效果好,可避免误差传递,提高分类准确率,整体模型复杂度低,降低模型开发的难度和工作量。
技术领域
本发明涉及计算机技术领域,尤其涉及一种多级分类对象的分类方法和装置。
背景技术
多级分类是指类别本身存在层级的一种多分类问题。多级分类的最大特点是类别间存在明显的亲疏关系,例如,生物分为动物和植物,动物分为脊索动物和无脊索动物,植物又分为苔藓植物、蕨类植物等,其中脊索动物与无脊索动物更加亲近,而与苔藓植物则比较疏远。现有的多级分类方案:方案一是采用常规机器学习模型,例如支持向量机、神经网络、朴素贝叶斯、决策树等,其认为类别间毫无关联,不考虑类别间的亲疏关系;方案二是采用级联模型,先建立各级分类的子分类器,再通过一些技巧将多个子分类器进行融合,例如,先建立1个一级子分类器用来判别动物或植物,再建立两个二级子分类器,分别用来判别是脊索动物或无脊索动物,以及苔藓植物或蕨类植物。
常规机器学习模型采用一刀切的处理方式,假设类别间毫无关联,不考虑类别之间的亲疏性,由于不能充分挖掘类间的隐藏信息,分类效果差强人意;传统级联模型一般采用判别式模型构建子分类器,先要确定一级分类,再用相应分类器确定二级分类,以此类推,其最主要缺点是当各级别分类拥有较多子类且分类层级较深时,往往需要构建数量庞大的子分类器,对模型开发的影响是灾难性的;此外,各级子分类器的误差向下传递,使得模型的累积误差随着分类层级的增加而迅速增长,较深层级的分类准确率较难保证。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有技术中,方案一未考虑类间的亲疏性,分类效果差;方案二存在累积误差,分类准确性差,且建模工作量大,模型复杂度高。
发明内容
有鉴于此,本发明实施例提供一种多级分类对象的分类方法和装置,能够考虑类间的亲疏性,分类效果好,并可避免误差传递,提高分类准确率,整体模型复杂度低,降低了模型开发的难度和工作量。
为实现上述目的,根据本发明实施例的一个方面,提供了一种多级分类对象的分类方法。
一种多级分类对象的分类方法,包括:利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。
可选地,在构建每一级级联分类模型之前,利用所述多级分类对象的样本特征数据训练该级的子分类器,其中,在每级只构建一个子分类器。
可选地,训练各级子分类器的步骤,包括:在训练第1级子分类器时,以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入,以所述多级分类对象的1级分类标注信息为训练目标;在训练第K级子分类器时,2≤K≤N,以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入,以所述多级分类对象的第K级分类标注信息为训练目标。
可选地,所述子分类器通过满足产生式、可追加训练和联合训练的模型构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910323668.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于实时视频播放方法、装置、设备以及存储介质
- 下一篇:键盘