[发明专利]一种基于改进二分k-均值算法的订单分组方法有效

专利信息
申请号: 201810398061.6 申请日: 2018-04-28
公开(公告)号: CN108648046B 公开(公告)日: 2021-08-10
发明(设计)人: 张艳伟;岑鹏 申请(专利权)人: 武汉理工大学
主分类号: G06Q30/06 分类号: G06Q30/06;G06K9/62
代理公司: 湖北武汉永嘉专利代理有限公司 42102 代理人: 张惠玲
地址: 430070 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 二分 均值 算法 订单 分组 方法
【权利要求书】:

1.一种基于改进二分k-均值算法的订单分组方法,其特征在于,包括如下步骤:

对订单数据集进行处理,获得订单集列表T={t1,t2…ti…tw};其中,ti表示第i个订单,第i个订单所包含的货品向量化表达为ti={aw1,aw2,…awi…awL};ti表示第i个订单,awi表示第w个订单包含第i种货品;

根据订单数量设置阈值TA的值;

在订单构成的簇类中选取参考订单:将该簇类中订单长度最大的订单作为第一个参考中心订单,计算簇类中其他订单与第一个参考中心订单的相似度,并在与第一个参考订单中心相似度最小的订单中,选择订单长度最大的订单作为第二个参考中心订单;

计算每个订单到每个参考中心订单的相似度rij,并将每个订单划分到与多个参考中心订单其中一者相似最大的一组;

对本次分组产生的所有簇类进行检测,查看是否满足预设的第一条件;

将满足第一条件的簇类标记为异常簇类,将异常簇类的参考中心订单标记为异常订单标记,并计算异常簇类中的所有订单与其他簇类参考中心订单的相似度,并将每个订单划分到与其他簇类参考中心订单相似度最大的簇类中;

将剩下的所有簇类按照其SSi的值大小进行降序排序,将前N个簇类进行k-means二次聚类(k=2),使得簇类数量保持不变;SSi为第i个簇类的订单相似度平方差的均值;

更新每个簇类的参考中心订单,并按照前述步骤进行进行分组迭代,直至参考中心订单不再发生改变或迭代次数达到最大迭代数;

判断现阶段最大SSi值是否小于等于TA,若是,则结束迭代,得出迭代分组结果TAST={G1…Gi…Gk},Gi表示第i个订单组;若否,则继续迭代,重复前述步骤,直至SSi值小于等于TA。

2.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,第i个簇类的订单相似度平方差的均值为

3.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,

两个订单之间相似度为

4.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,

第一条件的公式表示为:∣(ZLi-AG)∣≥2*STD;

其中,

AG为本次迭代中所有簇类的长度的均值;STD为本轮迭代中所有簇类长度的标准差;ZLi为第i个簇类的订单数。

5.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,更新每个簇类的参考中心订单的更新公式为:

6.根据权利要求1所述的基于改进二分k-均值算法的订单分组方法,其特征在于,在订单构成的簇类中选取参考订单的步骤之前,将所有订单看作为一个簇类,并对于进行k-means聚类,k=2,使其一分为二。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810398061.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top