[发明专利]模型生成方法及装置、数据处理方法及装置在审
申请号: | 201810916998.8 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109146076A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 刘志鹏;高睿;邹存璐 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N99/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子模型 模型生成 输出结果 正确率 输出权重 数据处理 输出 训练数据集 集成学习 训练数据 预测 构建 整合 申请 | ||
1.一种模型生成方法,其特征在于,所述方法包括:
获得多个初始构建的子模型,对于每个所述初始构建的子模型均利用与其对应的训练数据集进行模型的训练,并使用每个训练后的子模型,对与其对应的训练数据集中输入数据进行输出结果的预测;所述训练数据集包括多个实例,每个实例包括输入数据和输出结果;生成的模型包括每个训练后的子模型;
根据目标子模型的预测正确率确定所述目标子模型的输出权重;所述目标子模型是所述每个训练后的子模型中的任意一个;所述预测正确率根据所述目标子模型的预测输出和与其对应的训练数据集中的输出结果得到;所述输出权重用于整合所述每个训练后的子模型的输出结果作为所述模型的输出。
2.根据权利要求1所述的方法,其特征在于,所述获得多个初始构建的子模型,对于每个所述初始构建的子模型均利用与其对应的训练数据集进行模型的训练,并使用每个训练后的子模型,对与其对应的训练数据集中输入数据进行输出结果的预测,具体包括:
获得初始构建的第一子模型和对应的第一训练数据集,并使用所述第一训练数据集训练所述初始构建的第一子模型;
将所述第一训练数据集中的输入数据输入训练后的第一子模型进行输出结果的预测,得到第一预测输出;
根据所述第一预测输出和所述第一训练数据集中的输出结果,统计所述第一训练数据集中预测错误的实例作为第二训练数据集;
获得初始构建的第二子模型,并使用所述第二训练数据集训练所述初始构建的第二子模型;
其中,所述初始构建的第一子模型和所述初始构建的第二子模型是所述多个初始构建的子模型中的任意两个,所述多个初始构建的子模型使用相同的模型算法和参数。
3.根据权利要求2所述的方法,其特征在于,所述统计所述第一训练数据集中预测错误的实例作为第二训练数据集,之后还包括:
判断所述第二训练数据集包括的实例数量与所述第一训练数据集包括的实例数量之间的比值是否小于第一阈值;
若否,则执行所述获得初始构建的第二子模型,并使用所述第二训练数据集训练所述初始构建的第二子模型;
若是,则执行所述根据所述每个训练后的子模型的预测正确率确定所述每个训练后的子模型的输出权重。
4.根据权利要求2所述的方法,其特征在于,所述根据目标子模型的预测正确率确定所述目标子模型的输出权重,具体包括:
计算目标训练数据集中实例数量与总训练数据集中实例数量的比值,得到修正参数;所述目标训练数据集是与所述目标子模型对应的训练数据集;所述总训练数据集至少包括所述目标训练数据集;
根据所述目标子模型的预测正确率和所述修正参数,得到所述目标子模型的输出权重。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
判断所述目标子模型的预测正确率是否小于第二阈值;
若是,则删除所述目标子模型。
6.一种数据处理方法,其特征在于,所述方法包括:
获取待处理数据;
将所述待处理数据输入多个训练后的子模型,得到每个所述训练后的子模型的输出;
根据所述每个训练后的子模型的输出和输出权重,得到所述待处理数据的处理结果;
所述多个训练后的子模型及其输出权重根据权利要求1-5任意一项所述的模型生成方法得到。
7.根据权利要求6所述的方法,其特征在于,所述根据所述每个训练后的子模型的输出和输出权重,得到所述待处理数据的处理结果,具体包括:
按照公式得到所述待处理数据的处理结果
其中,为第i个训练后的子模型Mi对所述模型的第q个结果的预测输出,若所述第i个训练后的子模型Mi对所述第q个结果的预测输出为是,则为1;若所述第i个训练后的子模型Mi对所述第q个结果的预测输出为否,则为0;Wi为所述第i个训练后的子模型Mi的输出权重;n为所述模型包括的训练后的子模型的数量;k为所述模型输出结果的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810916998.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于提升骨髓干细胞活性的超声激励参数优化方法
- 下一篇:一种SAT求解器