[发明专利]一种基于随机森林的时尚手袋销售预测方法无效
申请号: | 201910611386.2 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110517059A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 张壮裕 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 44329 广东广信君达律师事务所 | 代理人: | 杜鹏飞<国际申请>=<国际公布>=<进入 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于随机森林的时尚手袋销售预测方法,包括下述步骤:S1,根据城市获得的历史销售数据,按周划分,以数据中心度量填写缺失值;S2,分析建立模型的特征,进行特征工程;所述特征具体为:(1)按照实际的销售量情况,对城市划分等级;(2)考虑生活水平影响,获取所在季度的城市经济增速;S3,建立随机森林模型;本发明除了考虑历史销售数据,还考虑了其他外在的影响因素列为特征;利用随机森林模型,随机森林模型具有不用剪枝,不用进行特征选取,计算开销小,训练速度快的优点;本方法难易度适中,因此容易实施,实用性强。 | ||
搜索关键词: | 随机森林 历史销售数据 手袋 城市经济 计算开销 建立模型 数据中心 特征选取 影响因素 难易度 剪枝 度量 增速 销售量 时尚 预测 销售 分析 | ||
【主权项】:
1.一种基于随机森林的时尚手袋销售预测方法,其特征在于,包括下述步骤:/nS1,根据城市获得的历史销售数据,按周划分,以数据中心度量填写缺失值;/nS2,分析建立模型的特征,进行特征工程;所述特征具体为:/n(1)按照实际的销售量情况,对城市划分等级;/n(2)考虑生活水平影响,获取所在季度的城市经济增速;/n(3)该周天气特征,获取其总体天气情况,分为晴天、雨天、阴天,此为标称型特征,将其编码成三维二值特征,即在对应状态值的位置设置为1,其余位置都设置为0;/n(4)是否促销日,该周存在重要促销日如6.18、双11的划为等级4,元旦、春节划为等级3,端午、国庆划为等级2,剩余的节假日划为等级1,普通日子标0;/n(5)时尚手袋产品款式划分:主要有双肩包、挎包、手提包、手拿包,标称型特征,同样编码成二值特征;/n(6)有无肩带、有无配饰、有无防水涂层均为二元特征,“有”则标1,“无”则标0;/n(7)当季度流行颜色分为三种:冷色系、暖色系、中间色系;此为标称型特征,将其编码成三维二值特征。/nS3,建立随机森林模型;/nS3.1,将数据集划分为训练集S和测试集T,特征数量为M;/nS3.2,从原始数据集中有放回地抽取样本,样本大小和训练集S大小一致,一共进行k次,组成k个决策树,这k个训练集作为对应单个决策树的根节点开始训练;/nS3.3,从M个特征中随机选取m个特征,满足m<<M,以最小均方差为划分原则,利用这m个特征找到最佳分割点所在特征,如果满足终止条件则将当前节点设为叶节点,输出值为该样本集的平均值;/nS3.4,重复k次,产生k棵决策树,组成随机森林模型;/nS3.5,利用S3.4所得到的随机森林模型,对待预测集T进行预测,输出预测值。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910611386.2/,转载请声明来源钻瓜专利网。