[发明专利]一种基于极限梯度提升的云工作流任务执行时间预测方法在审
申请号: | 201910165772.3 | 申请日: | 2019-03-06 |
公开(公告)号: | CN109981749A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 李慧芳;韦琬雯;樊锐;胡光政;邹伟东;柴森春;夏元清 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙) 11639 | 代理人: | 唐华 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于极限梯度提升的云工作流任务执行时间预测方法,属于云计算技术领域。本方法首先从工作流任务构成、任务运行所依赖的资源及其物理执行环境三个层面对任务执行时间的影响因素进行分类,实现任务执行时间影响因素的全面建模。其次,针对样本数据集存在数据缺失值的情况,采用机器学习方法对存在缺失值的数据集进行补全。最后,借助于极限梯度提升算法的多类型数据处理能力、参数设计相对简单、计算量较少以及兼有串、并行学习器的优势,采用限梯度提升算法训练云工作流任务执行时间预测模型。相对于现有的预测模型,不仅放宽了对样本数据类型的限制、减小了预测误差,而且使模型的泛化能力进一步提升。 | ||
搜索关键词: | 任务执行 工作流 时间预测 数据处理能力 样本数据类型 参数设计 机器学习 任务运行 时间影响 数据缺失 算法训练 样本数据 影响因素 预测模型 预测误差 多类型 计算量 数据集 学习器 云计算 减小 建模 算法 并行 分类 | ||
【主权项】:
1.一种基于极限梯度提升的云工作流任务执行时间预测方法,其特征在于,包括以下步骤:步骤一、对云工作流任务执行时间影响因素进行建模;建模涉及云工作流任务本身、云工作流运行物理环境及其资源配置;步骤二、根据步骤一建立的云工作流任务执行时间影响因素模型,采集所有相关数据;同时,记录相应于影响因素的云工作流任务执行时间;步骤三、对步骤二采集的相关数据进行缺失值检验;如果存在数据缺失,则进行数据补全,然后执行步骤四;如果不存在数据缺失,则执行步骤四;步骤四、利用检测后的相关数据,构建云工作流任务执行时间预测模型的样本数据集,将样本数据集划分为训练数据集与测试数据集,分别用于训练与测试,将影响因素数据和任务执行时间数据分别作为预测模型的输入、输出;步骤五、在步骤四构建的样本数据集上,采用极限梯度提升学习云工作流任务执行时间及其影响因素之间的非线性映射关系,训练并构建云工作流任务执行时间预测模型;步骤六、将待预测的云工作流任务影响因素,输入到步骤五训练好的模型中,实现云工作流任务执行时间的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910165772.3/,转载请声明来源钻瓜专利网。