[发明专利]一种基于K-means和LSTM的日游客量预测方法有效
申请号: | 202010506167.0 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111652444B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 袁佳 | 申请(专利权)人: | 南京机电职业技术学院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/14;G06F18/23213;G06N3/0442 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 211135 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means lstm 游客 预测 方法 | ||
本发明涉及一种基于K‑means和LSTM的日游客量预测方法建立日游客量预测样本序列数据库,采用Kmeans算法对样本数据集进行聚类分析,基于分析结果建立LSTM预测模型,景区利用预训练好的模型对日游客量进行预测,并在线对现有的模型进行优化升级。本发明准确地预测出后续的游客量,预测精度高,让旅游经营和管理者提前对游客量有一个清晰的认知,从而提升旅游者的出行体验和优化旅游产业。
技术领域
本发明涉及游客量预测领域,特别涉及基于一种基于K-means和LSTM的日游客量预测方法。
背景技术
随着经济飞速的发展,我国的国民生活水平普遍提高,旅游行业作为新兴行业异军突起,逐渐成为了我国部分地区的主要甚至是支柱产业。近年来,景区超载、游客拥挤等问题层出不穷,带来的安全隐患严重影响了旅游者的出行体验,同时也限制了旅游产业的健康发展。
现有的基金价格模型多采用传统机器学习的方法,而日游客量受多因素耦合影响,多特征因素与日游客预测有着高度的非线性,现有方法受限于非线性数据挖掘能力导致预测精度往往不高。另一方面,绝大数方法没有考虑日游客预测的多模态属性,忽略了实际应用情况中,日游客量与旅游行情模式存在着固有关联。因此,亟待提出一种预测精度高的日游客量预测方法,准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知,通过合理调度和配置有限旅游资源的方式最大限度的避免这种混乱局面的产生,从而提升旅游者的出行体验和优化旅游产业。
发明内容
为了解决上述存在问题。本发明提出一种基于K-means和LSTM的日游客量预测方法,准确地预测出后续的游客量,让旅游经营和管理者提前对游客量有一个清晰的认知,通过合理调度和配置有限旅游资源的方式最大限度的避免这种混乱局面的产生,从而提升旅游者的出行体验和优化旅游产业。为达此目的:
本发明提出一种基于K-means和LSTM的日游客量预测方法,具体步骤如下:
步骤1:日游客预测系统录入景区每天的游客相关百度指数以及实际日游客量;
步骤2:将步骤1的游客因素特征数据进行归一化处理;
步骤3:基于步骤2处理好的数据,采用动态时窗的方法提取序列,建立日游客量预测样本序列数据库;
步骤4:采用Kmeans算法对样本数据集进行聚类分析,将样本集分成3个训练集,分别对应淡季、旺季和平稳季;
步骤5:分别对步骤4中的3个训练集建立LSTM预测模型,并训练直到网络收敛;
步骤6:景区上传过去几天的日游客相关百度指数以及实际日游客量作为待预测样本,经过步骤2的归一化处理,基于Kmeans算法对预测样本进行分类得出旅游季的模式类别;
步骤7:针对步骤6的类别结果,利用步骤5中预训练好的模型对日游客量进行预测,并将结果上传至显示界面;
步骤8:对于预测值差较大的情况,数据库每隔一个周期将数据发送至上位机,在线对现有的模型进行优化升级,从而不断提升模型预测精度。
作为本发明进一步改进,所述步骤1中景区每天的游客相关百度指数,主要关键词“景区名”百度指数、关键词“景区名+旅游攻略”百度指数、关键词“景区名+天气”百度指数、关键词“景区名+门票”百度指数、关键词“景区名+在哪里”百度指数等。
作为本发明进一步改进,所述步骤2中数据归一化处理为:
其中,xi是第i个游客因素特征的归一化处理的结果,和为第i个游客因素特征的原始数据的最大值和最小值,为第i个游客因素特征的归一化前的数值,i∈{1,2,…,n},n为游客因素特征数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京机电职业技术学院,未经南京机电职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010506167.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理