[发明专利]一种分类器构建方法及预测分类的方法在审

申请号：	201810098965.7	申请日：	2018-01-31
公开（公告）号：	CN108171280A	公开（公告）日：	2018-06-15
发明（设计）人：	夏耘海;李燕伟;王甲樑	申请（专利权）人：	国信优易数据有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京超凡志成知识产权代理事务所(普通合伙) 11371	代理人：	陈剑
地址：	100070 北京市丰台***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分类器构建模型训练预测分类器分类训练数据集准确度分类信息候选模型属性特征自变量属性信息训练样本预测目标从属性错误率因变量样本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种分类器构建方法及预测分类的方法，其中，该分类器构建方法包括：获取多个训练样本的训练数据集；其中，训练数据集包括属性信息和分类信息；从属性信息中提取属性特征；将属性特征作为初始自变量，将对应的分类信息作为初始因变量进行至少一轮模型训练；其中，每一轮模型训练由至少两个候选模型参与；将每一轮模型训练中错误率最小的模型的组合，作为完成训练的分类器。通过本发明提供的分类器构建方法及预测分类的方法，基于至少两个候选模型进行至少一轮模型训练以得到分类器，并能够根据训练好的分类器预测目标样本的分类，避免了采用单一的分类方法所带来的预测精度和预测准确度均较差的问题，预测的精度和准确度均较高。

技术领域

本发明涉及计算机技术领域，具体而言，涉及一种分类器构建方法及预测分类的方法。

背景技术

分类算法就是基于分类模型将待检测样本从可选的分类中选取最佳的类别假设，例如，借贷分类模型可以把一个客户对借贷平台的借款意图分类为可能借贷或者不可能借贷。

对应于上述分类模型，主要包括模型训练阶段、模型验证阶段和模型应用阶段。其中，上述模型训练阶段，就是要建立模型，使用历史数据集来建立分类模型，模型验证阶段，即是要验证根据历史数据集合建立的上述模型，如利用交叉验证方式进行验证，模型应用阶段，即是根据建立的分类模型来预测未知类别的数据。

常见的分类算法包括决策树分类、贝叶斯分类，神经网络分类以及逻辑回归分类等分类算法。然而，上述分类算法均采用单一的分类方法，在应用到实际业务数据时，由于算法本身的局限性，不能达到一个较好的预测精度和预测准确度。

发明内容

有鉴于此，本发明的目的在于提供一种分类器构建方法及预测分类的方法，以提高分类预测的精度和准确度。

第一方面，本发明提供了一种分类器构建方法，所述方法包括：

获取多个训练样本的训练数据集；其中，所述训练数据集包括属性信息和分类信息；

从所述属性信息中提取属性特征；

将所述属性特征作为初始自变量，将对应的分类信息作为初始因变量进行至少一轮模型训练；其中，每一轮模型训练由至少两个候选模型参与；