[发明专利]一种针对地理网点的智能任务分配和人员调度方法、系统在审
申请号: | 201910689985.6 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110458429A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 汤胤;廖冬雪;黄书强 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06N3/08 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 刘巧霞<国际申请>=<国际公布>=<进入 |
地址: | 510632广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拜访 强化学习 网点 地理位置特征 历史数据建模 企业信息系统 神经网络模型 计划网络图 策略优化 分配策略 环境信息 基础数据 决策模块 路线优化 匹配策略 全局最优 人员调度 任务分配 任务执行 商业网点 实时数据 提取特征 二分图 迭代 预设 奖赏 惩罚 反馈 智能 评估 收益 更新 规划 学习 | ||
1.一种针对地理网点的智能任务分配和人员调度方法,其特征在于,步骤为:
(1)从企业信息系统决策模块的基础数据和实时数据中提取特征,特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征;
(2)对业务员和拜访网点之间的关系,形成拜访计划的二分网络,同时根据地理位置关系对网点集合建立偏序关系,对历史记录和业务员拜访网点的实时数据建模,得到深度神经网络模型;
(3)根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,更新学习参数,确定最优任务执行策略;
(4)根据业务员所处环境信息,规划最优拜访路线;
(5)实际拜访过程中,将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。
2.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(1)中,所述待拜访网点的特征包括:拜访网点类型以及网点基本信息,所述拜访网点类型包括已有网点、潜在待开发网点、疑似假网点,所述网点信息包括经营者基础信息、地理位置、经营品类、供货方式、产品库存;所述业务员的特征包括:基础信息、业务能力、历史拜访记录、熟悉的网点和范围、熟悉的产品类目;所述拜访任务的特征包括:网点和业务员之间的交互情况,即该网点是否被业务员拜访、拜访任务的难度、拜访的预期目标;所述业务员的周边环境包括:业务员的时间和空间状态,即所处地理位置、交通状况、拜访时间。
3.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(2)中,神经网络模型的输入是状态集S和动作集A,业务员的特征和业务员周边环境表示状态集S,待拜访网点的特征和拜访任务的特征表示动作集A。
4.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(2)中,在建立的深度神经网络模型的过程中,用二分图来表示业务员和拜访网点之间的匹配关系,在该二分图中,将业务员和网点作为节点,业务员与网点的初始是全连接状态,在与环境的交互过程中,随着连接边上的权重不断更迭,同时,根据地理位置关系对网点集合建立偏序关系,获得最优匹配策略。
5.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(3)中,完成该拜访动作a后会带来奖励,奖励r定义为拜访网点的总执行时间和拜访网点的效果,同时完成该拜访动作后会自动使业务员发生状态的转移,即从st转换到st+1;将效果等反馈信息反馈给模型,用于计算在某状态下的预期累积收益的期望的动作价值函数Q(s,a),该价值函数表示业务员和网点之间连接边的权重,即学习参数,不断更迭价值函数,求解最优匹配,进而确定最优任务执行策略。
6.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(4)中,确定最优任务执行策略后,进行拜访路线规划,即根据周围环境因素规划最优网点拜访顺序和路径,周围环境因素包括实时路况、距离远近。
7.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(5)中,实际拜访过程中,实时评估业务员的位置和拜访计划完成情况,分析是否有无法完成日常规定拜访网点的风险,及时改派;日常已有网点优先拜访,再根据业务员实施拜访情况和业务员的位置,分配待开发的新店。
8.一种针对地理网点的智能任务分配和人员调度系统,其特征在于,
特征提取模块,从企业信息系统决策模块的基础数据和实时数据中提取特征,包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征;
深度强化学习模型构建模块,用于对业务员和拜访网点之间的关系,形成拜访计划的二分网络,同时根据地理位置关系对网点集合建立偏序关系,对历史记录和业务员拜访网点的实时数据建模,得到深度神经网络模型;
任务匹配策略优化模块,用于根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,更新学习参数,确定最优任务执行策略
拜访路线优化模块,用于根据业务员所处环境信息,规划最优拜访路线;
拜访方式确定模块,用于实际拜访过程中,将任务匹配策略优化模块中的任务执行策略优化方法以及任务匹配策略优化模块中的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910689985.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理