[发明专利]基于Gumbel-softmax技术的组合优化方法在审
申请号: | 202010453858.9 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111639797A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李垚鑫;张江 | 申请(专利权)人: | 北京师范大学;集智学园(北京)科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62;G06N20/00;G06N3/08;G06N3/12;G06N3/00 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gumbel softmax 技术 组合 优化 方法 | ||
本发明公开了基于Gumbel‑softmax技术的组合优化方法,应用目标为组合优化问题(combinatorial optimization problems),主要致力于使用深度学习的技术解决图上的组合优化问题,涉及深度学习领域的自动微分技术、Gumbel‑softmax采样技术、进化策略与遗传算法。通过Gumbel‑softmax重参数化技术将图上的组合优化问题转化成可微分的连续函数优化问题,进而使用深度学习领域的自动微分技术对参数进行优化。通过并行地在GPU上运行,能够有效提升算法的表现与效率。本发明可以得到定义在图上的组合优化问题的最优可行解,可用于网络结构优化问题。
技术领域
本发明涉及计算机技术领域,具体属于机器学习与优化算法领域,应用目标为组合优化问题(combinatorial optimization problems),主要致力于使用深度学习的技术解决图上的组合优化问题,具体涉及深度学习领域的自动微分技术、Gumbel-softmax采样技术、进化策略与遗传算法。
背景技术
我们现实生活中存在许多组合优化问题,比如生产调度问题和旅行商问题。计算机科学中也存在着大量定义在图上的组合优化问题,如最大独立集(maximum independentset)和最小顶点覆盖(minimal vertex cover)问题等;在统计物理领域中也存在一种自旋玻璃模型,需要我们在指定的图结构上找到最优的粒子自旋状态组合,使得系统的基态能量最低;在网络科学中更是有许多图上的组合优化问题,比如作为社团划分的重要评价指标,模块度的优化是非常重要的。这些图上的组合优化问题需要我们在满足某些约束的情况下找到图上的最大或最小的子图。通常这类问题属于NP难或者NP完备的,可行解的数量随着网络的大小指数增长,因此无法通过穷举搜索或枚举法求解。
对于这类组合优化问题,有很多经典的通用算法能够求解。坐标下降法(Coordinate descent)是一种能够解决优化问题的经典算法,它可以通过坐标方向或坐标超平面进行一维搜索从而实现优化;粒子群优化算法(Particle swarm optimization)是一种基于种群的通用算法,它通过模仿自然界中大量生物个体的信息交流共享来解决优化问题,有较强的通用性和随机性;同样源于仿生的还有Holland提出的遗传算法(Geneticalgorithm),它通过将解空间编码、引入选择和交叉变异等操作,从而模仿生物遗传过程中基因和染色体的变化,是一种非常经典且通用的算法;在物理和复杂系统领域也存在着许多优化算法,典型的有模拟退火算法(Simulated annealing)和极值优化算法(Extremaloptimization),模拟退火算法来源于固体退火原理,是一种基于概率的算法,先将固体加温至充分高,再让其逐渐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小;极值优化算法源于复杂系统自组织临界的思想,算法从优化问题内部变量之间的联系出发,将问题本身作为一个演化的复杂系统,变量之间的相似性构成了变量之问比较、竞争、交流的条件,变量在局部寻优的过程中,驱动整个系统向最优解运动。
然而这些算法都存在一些弊端。一是它们都没有能够很好地利用系统的梯度信息,二是它们大都需要领域知识作为启发式信息,三是它们的时间复杂度较大,对于系统规模要求较高。因此这些经典的通用算法在解决图上的组合优化问题时通常难有很好的表现。
目前,得益于机器学习和深度学习领域的快速发展,很多更为先进的技术手段能够被用于解决图上的组合优化问题。基于计算图和张量计算的自动微分技术使得梯度下降优化能够快速、自动完成,从而使得基于梯度的优化算法更具竞争力。针对组合优化问题离散的性质,强化学习领域提出了以REINFORCE为代表的梯度估计算法,能够很好的解决可导性的问题。而近些年提出的Gumbel-softmax技术通过将采样过程可微化,使得梯度能够完整地反向传播从而实现优化。我们的算法框架正是基于自动微分技术和Gumbel-softmax技术。
本发明应用了若干计算机和机器学习领域的先进技术,主要包括以下方面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学;集智学园(北京)科技有限公司,未经北京师范大学;集智学园(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010453858.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理