[发明专利]一种基于DQN算法原理的工作流调度方法在审
申请号: | 202111229998.9 | 申请日: | 2021-10-21 |
公开(公告)号: | CN113888136A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 于劲松;廖晨阳;张润芝;乐祥立;刘浩;李鑫 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dqn 算法 原理 工作流 调度 方法 | ||
1.基于DQN算法原理的工作流调度方法,其特征在于:所述工作流调度系统包括工作流实例处理模块、状态观测模块、双DQN训练模块、智能化综合调度模块四大部分。工作流实例处理模块负责将总体状态信息解析为对应格式的数据并生成初始的DAG图;双DQN训练模块基于工作流实例处理模块解析得到的结构化数据训练并整定模型参数;状态观测模块负责在训练整定参数和输出调度结果的过程中为双DQN训练模块和智能化综合调度模块提供每一步训练和调度结果输出的状态特征计算。
2.根据权利要求1所述的基于DQN算法原理的工作流调度方法,其特征在于:采用TCP/IP协议与目标OA系统实现数据和调度结果信息的交互。整个交互流程通过HttpRequest的方式实现,具有轻量化松耦合的特点。在数据信息交互部分,发明提出在目标OA客户端实现大数据分析计算和建模的方法,并给出了回调时的数据结构,运用边缘计算方法减轻服务器压力。
3.根据权利要求1所述的基于DQN算法原理的工作流调度方法,其特征在于:运用强化学习算法解决办公自动化领域的工作流实例综合调度问题,将DDQN网络与办公自动化领域各项状态参数的结合,从而构建了双DQN训练模块、智能化综合调度模块。前者通过在线无监督的方式进行参数的整定,为后者的综合调度输出提供网络参数。
4.根据权利要求3所述的双DQN训练模块,其特征在于:所述模块采用双DQN(DDQN)强化学习方法整定Q值网络的参数。所述Q值网络采用人工神经网络进行构建,结构适应于办公自动化领域,由输入层、双隐层、输出层构成。发明提出了如下7个状态观测特征,组成了DDQN网络的输入向量:办公人员/组的时间平均利用效率、办公人员/组的时间平均利用效率标准差、平均办理进度、办理时间标准差、预计延迟率、实际延迟率、平均办结时间。具体计算公式见说明书。
5.根据权利要求4所述的Q值网络,其特征在于:所述Q值网络的输出为7维独热码,代表从7个调度规则中选择一种进行状态转换。发明提出了7中适应于办公自动化领域的调度规则,Q值网络的输出不是具体的调度步骤,而是先选择调度规则,再由具体的调度规则执行器计算得出应执行的工作流实例、应进行的工作流活动实例以及办理该工作流活动的办公人员。
6.根据权利要求1所述的工作流实例处理模块,其特征在于:采用本发明提供的任务DAG图构建方法和剩余任务节点DAG图构建方法进行数据解析。该模块首先通过解析前提条件删除环结构、而后构建DAG图。当某个DAG图对应的工作流实例已经有部分工作流活动实例被执行,则对剩余的未执行工作流活动构建生成剩余任务节点DAG图。
7.根据权利要求1所述的双DQN训练模块和智能化综合调度模块的动作执行算法部分,其特征在于:对DAG图进行更新的算法按照本发明提出的方法进行。所述方法步骤如下:
1)通过检查DAG矩阵的全零列输出可执行任务节点
2)根据Q值网络输出的7维独热码选择需要被执行的特定任务节点并执行,将被执行的节点对应的DAG矩阵行赋值为全零行
3)将第二步中被执行任务节点对应的某个行列元素赋值为1
4)通过检查DAG图对角线元素是否全部为1判断DAG图对应的任务是否完成
5)如执行完成则返回动作序列和奖励,若未执行完成则重复执行1)至5)
所述算法可参见附图7。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111229998.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理