[发明专利]一种基于集成学习的差错控制方法和系统在审
申请号: | 201810186544.X | 申请日: | 2018-03-07 |
公开(公告)号: | CN108537343A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 江树浩;鄢贵海;李晓维 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06F11/14 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习器 差错控制 集成学习 评价指标 收敛 最大程度地 动态调整 方式优化 能耗节省 顺序优化 训练步骤 预测结果 实时性 并行 能耗 平衡 优化 保证 | ||
本发明涉及一种基于集成学习的差错控制方法,用于通过动态调整基学习器的执行数量实现最优收敛;其中所述集成学习的差错控制方法包括:训练步骤,对集成学习中各基学习器进行训练;回测步骤,确定各基学习器的评价指标,用于后续基学习器执行的优化;执行顺序优化步骤,根据评价指标确定各学习器执行的先后顺序;执行方式优化步骤,根据评价指标确定各学习器执行方式为串行或并行;收敛步骤,基学习器根据输入数据最快地终止执行,同时保证预测结果的准确性。本发明能够以最大程度地减少能耗开销,同时不损失差错控制质量,实现最优的能耗节省与实时性的平衡。
技术领域
本发明属于集成学习技术和差错控制技术领域,具体涉及一种基于集成学习的差错控制方法和系统。
背景技术
差错是指理想输出结果和实际输出结果的差异。但是由于得到理想的输出结果的计算过程一般复杂度较高,时间和能耗开销过大,或者完整的计算过程在现有的条件下无法实现,往往会采用一些精简的计算来代替完整的计算过程,精简计算的结果即实际输出结果和理想结果之间存在差错,其中部分差错是不能被应用所容忍的,因此需要差错控制方法来有效地控制实际结果和理想结果之间的差错。如对于部分视频图像处理相关的应用,一些高效算法可以代替完整算法以提高效率,但是图像的质量会降低,这时就需要差错控制技术判断当前的图像能否被接受,如果不能被接受,则要重新以完整算法得出满足要求的图像结果。
现有的差错控制技术分为两大类,第一类是基于输出的误差控制方法,该方法首先通过计算等方式得到理想输出结果,再将其与实际输出结果比较得到二者的差异从而实现差错控制,但这类方法计算所有数据的理想结果的时间开销和能耗开销过大,实际的误差控制往往采用抽样的方式,因此无法保证未被抽样的数据结果的正确性。第二类是基于输入的误差控制方法,该方法分为两个阶段,训练阶段和预测阶段,在训练阶段,预测模型根据训练数据被训练得到;在预测阶段,预测模型根据输入数据预测出差错,进而实现误差控制。这种方法能够覆盖所有的数据,但是由于实时性和能耗开销的考虑,预测模型不能太复杂,从而导致模型预测的精度不高。
综上所述,现有技术中的主要缺陷在于无法解决误差控制质量(如数据的覆盖程度,预测精度)与误差控制开销之间的矛盾,以基于输入的误差控制方法为例,简单的预测模型开销低,但其预测精度差,而复杂的预测模型虽然能够提升精度,但其模型开销又过大。
发明内容
针对上述问题,本发明提出一种基于集成学习的差错控制方法,包括:
训练步骤,对集成学习中的N个初始学习器分别进行训练以得到对应的N个基学习器;其中N为正整数;
回测步骤,将训练数据输入该基学习器,以获得该基学习器的评价指标;
执行顺序优化步骤,根据该评价指标确定所有该基学习器的执行顺序,以得到该基学习器按执行顺序形成的第一策略;
执行方式优化步骤,根据该评价指标及该执行顺序确定所有该基学习器的执行方式,以将所有该基学习器的执行划分为并行执行和串行执行,得到该基学习器按执行方式形成的第二策略;
收敛步骤,设定该集成学习的预测阈值,所有该基学习器结合形成集成学习器,将输入数据执行该集成学习器以该第一策略或该第二策略得到结合结果,并判断该结合结果是否满足该预测阈值,当满足时终止执行过程并返回预测结果。
本发明所述的差错控制方法,其中所述训练步骤具体包括:该初始学习器为包括决策树、线性模型、查找表的任一学习器,该基学习器的结合策略为简单平均法、加权平均法、投票法的任一方法,使用包括Boosting、Bagging、随机森林的任一方法进行训练。
本发明所述的差错控制方法,其中所述回测步骤的该评价指标包括:coverage,为该基学习器对该训练数据的预测准确率;weight,为该基学习器在该集成学习中的权重参数;以及该基学习器单次预测的平均运行时间和平均能耗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810186544.X/2.html,转载请声明来源钻瓜专利网。