[发明专利]基于决策树的店铺选址方法在审
申请号: | 202010910154.X | 申请日: | 2020-09-02 |
公开(公告)号: | CN111985576A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 潘颖;赖晓聪;李雄;蒋雪玲 | 申请(专利权)人: | 南宁师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02;H04W4/021 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 邓雪明 |
地址: | 530299 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 店铺 选址 方法 | ||
本发明公开了一种基于决策树的店铺选址方法,实现过程包括:获取与欲开设店铺同类型的已有店铺的第一信息并进行数据预处理;使用聚类算法对已有店铺进行聚类,通过店铺簇的影响范围确定潜力区域,寻找欲开设店铺的候选地址;使用已有店铺的多个第一信息通过皮尔森相关系数、方差的方法构建CART决策树模型;将候选地址通过CART决策树模型进行训练,根据所占比值进行推荐。本发明通过缩小选址的区域范围,减少地址分析的工作量,在确定潜力区域的基础上进行地址分析,更快定位店铺候选地址。
技术领域
本发明涉及数据挖掘技术领域。更具体地说,本发明涉及一种基于决策树的店铺选址方法。
背景技术
选址对于店铺经营优劣是一个至关重要的因素,如何借鉴同类型的店铺经验来提高选址的准确度,过去采用市场调查、发放问卷等,耗费大量的人力与物力,所得的分析结果相对较差。在中心商圈的店铺竞争愈加激烈的情况下,中心商圈逐渐出现劣势,如:人群拥挤、交通拥挤等。因此,急需一种店铺选址方法,通过采用对现有数据进行深度挖掘得出具有很大潜力的店铺地址。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于决策树的店铺选址方法,利用聚类等方法寻找候选地址集,通过训练出CART决策树模型对候选地址集进行归类,以此分析得最优开店地址。
为了实现根据本发明的这些目的和其它优点,提供了一种基于决策树的店铺选址方法,其包括:
在预设范围内获取与欲开设店铺相同类型的已有店铺的多个第一信息,多个第一信息中包括外卖送达最远距离和地理位置;
通过可视化聚类的方法对已有店铺进行聚类,以将已有店铺分为k个簇,得到簇集A={A1、A2、…、Ak},每个簇包含符合相应簇条件的多个已有店铺;
根据外卖送达最远距离划定每个簇的影响范围Ω,获取两个或两个以上簇影响范围相交区域的集合i∈[1,k],j∈[1,k];
获取所有处于两个或两个以上簇影响范围相交区域中的待出租门面的多个第一信息;
使用已有店铺的多个第一信息构建CART决策树模型;
将待出租门面的多个第一信息输入CART决策树模型,得到最佳店铺选址。
优选的是,多个第一信息中还包括盈利额,使用已有店铺的多个第一信息构建CART决策树模型的过程包括:
S1、以盈利额为因变量因素,以其他第一信息为自变量因素,通过计算皮尔森相关系数的方法得出已有店铺的多个第一信息中,盈利额分别与其他第一信息的相关系数;
S2、计算已有店铺的每个其他第一信息的数据集方差,选择方差小于第一预设值且相关系数大于第二预设值的其他第一信息,组成特征集Z;
S3、从特征集Z中选择方差最小的其他第一信息作为CART决策树结点,在该结点数据集中选择能使分裂后左右子数据集的总方差最小的数值进行结点分裂;
S4、重复S3,直至当分裂后,结点的数据量小于第三预设值时,结点停止分裂。
优选的是,将待出租门面的多个第一信息输入CART决策树模型,得到最佳店铺选址的过程包括:
将每一待出租门面的多个第一信息输入CART决策树模型中,得到该待出租门面的环境分支归类,统计每个环境分支归类中包含的待出租门面的数量,选取包含最多待出租门面数量的环境分支归类作为最佳店铺选址环境,而最佳店铺选址环境中包含的待出租门面地理位置即均为最佳店铺选址。
优选的是,获取已有店铺的多个第一信息后,还对已有店铺的多个第一信息进行归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南宁师范大学,未经南宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010910154.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于激光-机械破岩试验的光路传输装置
- 下一篇:一种计算器的计算控制方法