[发明专利]一种基于改进二分k-均值算法的订单分组方法有效
申请号: | 201810398061.6 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108648046B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 张艳伟;岑鹏 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 张惠玲 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 二分 均值 算法 订单 分组 方法 | ||
1.一种基于改进二分k-均值算法的订单分组方法,其特征在于,包括如下步骤:
对订单数据集进行处理,获得订单集列表T={t1,t2…ti…tw};其中,ti表示第i个订单,第i个订单所包含的货品向量化表达为ti={aw1,aw2,…awi…awL};ti表示第i个订单,awi表示第w个订单包含第i种货品;
根据订单数量设置阈值TA的值;
在订单构成的簇类中选取参考订单:将该簇类中订单长度最大的订单作为第一个参考中心订单,计算簇类中其他订单与第一个参考中心订单的相似度,并在与第一个参考订单中心相似度最小的订单中,选择订单长度最大的订单作为第二个参考中心订单;
计算每个订单到每个参考中心订单的相似度rij,并将每个订单划分到与多个参考中心订单其中一者相似最大的一组;
对本次分组产生的所有簇类进行检测,查看是否满足预设的第一条件;
将满足第一条件的簇类标记为异常簇类,将异常簇类的参考中心订单标记为异常订单标记,并计算异常簇类中的所有订单与其他簇类参考中心订单的相似度,并将每个订单划分到与其他簇类参考中心订单相似度最大的簇类中;
将剩下的所有簇类按照其SSi的值大小进行降序排序,将前N个簇类进行k-means二次聚类(k=2),使得簇类数量保持不变;SSi为第i个簇类的订单相似度平方差的均值;
更新每个簇类的参考中心订单,并按照前述步骤进行进行分组迭代,直至参考中心订单不再发生改变或迭代次数达到最大迭代数;
判断现阶段最大SSi值是否小于等于TA,若是,则结束迭代,得出迭代分组结果TAST={G1…Gi…Gk},Gi表示第i个订单组;若否,则继续迭代,重复前述步骤,直至SSi值小于等于TA。
2.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,第i个簇类的订单相似度平方差的均值为
3.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,
两个订单之间相似度为
4.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,
第一条件的公式表示为:∣(ZLi-AG)∣≥2*STD;
其中,
AG为本次迭代中所有簇类的长度的均值;STD为本轮迭代中所有簇类长度的标准差;ZLi为第i个簇类的订单数。
5.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,更新每个簇类的参考中心订单的更新公式为:
6.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,在订单构成的簇类中选取参考订单的步骤之前,将所有订单看作为一个簇类,并对于进行k-means聚类,k=2,使其一分为二。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810398061.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子商务订单管理系统
- 下一篇:一种云平台与酒店相结合的网络互动方法