[发明专利]一种基于改进二分k-均值算法的订单分组方法有效
申请号: | 201810398061.6 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108648046B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 张艳伟;岑鹏 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 张惠玲 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 二分 均值 算法 订单 分组 方法 | ||
本发明公开了一种基于改进二分k‑均值算法的订单分组方法,采用改进的二分k‑均值算法求解对配送中心订单分批问题,从k值选取、初始中心值的选取、异常点处理三个方面对k‑means聚类算法进行了改善,避免算法陷入局部最优,使得求解出的订单分组方案更加有效合理,从而有效提高订单分拣效率。
技术领域
本发明涉及一种分组方法,具体是一种基于改进二分k-均值算法的订单分组方法。
背景技术
随着电商的发展,电商每天会接收到大量的订单,而这些订单呈小批量、多品种、多批次的特点。对于这些大规模的订单,电商的物流中心压力日益增大。
订单分组是将收集到的客户订单按照特定的规则进行分组,将同一组的订单安排在同一个工作台进行分拣,以缩短订单拣选时间,提高拣选效率。目前,订单分组策略有:1、种子算法,2、节约算法,3、优先规则算法,4、启发式算法,5、数据挖掘算法。
种子算法的初始种子数据难以找到较优的值,对于大规模的订单难以求出最优分组方案;优选规则算法是将客户订单进行分级,按照订单的优先级进分组,但其没有考虑订单之间的关联性,获得的分组方案往往不能有效缩减分拣效率;而一般的启发式算法并不能适用于大规模的订单集合;对于数据挖算法,现阶段用于订单分组问题的主要有两种算法:关联规则挖掘、k-means聚类算法。这两种算法适用于大规模的订单集合分组问题,但目前基于k-means算法的订单分组方案,并没有合理改进算法的三个限制:1、k值的确定,2、初始中心的确定,3、异常数据点的处理,使得现阶段的方案并没能有效提高系统的分拣效率。
发明内容
本发明的目的在于提供一种基于改进二分k-均值算法的订单分组方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于改进二分k-均值算法的订单分组方法,包括如下步骤:对订单数据集进行处理,获得订单集列表T={t1,t2…ti…tw};其中,ti表示第i个订单,第i个订单所包含的货品向量化表达为ti={aw1,aw2,…awi…awL};ti表示第i个订单,awi表示第w个订单包含第i种货品;
根据订单数量设置阈值TA的值;
在订单构成的簇类中选取参考订单:将该簇类中订单长度最大的订单作为第一个参考中心订单,计算簇类中其他订单与第一个参考中心订单的相似度,并在与第一个参考订单中心相似度最小的订单中,选择订单长度最大的订单作为第二个参考中心订单;
计算每个订单到每个参考中心订单的相似度rij,并将每个订单划分到与多个参考中心订单其中一者相似最大的一组;
对本次分组产生的所有簇类进行检测,查看是否满足预设的第一条件;
将满足第一条件的簇类标记为异常簇类,将异常簇类的参考中心订单标记为异常订单标记,并计算异常簇类中的所有订单与其他簇类参考中心订单的相似度,并将每个订单划分到与其他簇类参考中心订单相似度最大的簇类中;
将剩下的所有簇类按照其SSi的值大小进行降序排序,将前N个簇类进行k-means二次聚类(k=2),使得簇类数量保持不变;SSi为第i个簇类的订单相似度平方差的均值;
更新每个簇类的参考中心订单,并按照前述步骤进行进行分组迭代,直至参考中心订单不再发生改变或迭代次数达到最大迭代数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810398061.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子商务订单管理系统
- 下一篇:一种云平台与酒店相结合的网络互动方法