[发明专利]一种基于机器学习的游客流量预测方法在审
申请号: | 201810804596.9 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109034469A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 周道华;古鹏飞;曾俊 | 申请(专利权)人: | 成都中科大旗软件有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/14 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李英 |
地址: | 610000 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联数据 游客流量数据 客流量预测 基于机器 客流量 分类整理 机器学习 旅游景区 内在关联 影响旅游 综合考虑 便捷性 时间段 学习器 采集 融合 学习 风向 转换 风力 景区 天气 | ||
本发明公开了一种基于机器学习的游客流量预测方法,包括以下步骤:采集旅游景区的历史游客流量数据,并对该数据按年、月、日分类整理;获取上述历史游客流量数据相对应时间段的关联数据,所述关联数据包括最高气温、最低气温、天气、风向、风力、工作日情况中至少一种,并以天为单位将历史游客流量数据与关联数据汇总;将关联数据转换为数值并与历史游客流量数据融合;将关联数据、历史游客流量输入学习器中进行训练实现游客流量预测。本技术方案利用机器学习的方法,综合考虑影响旅游景区游客流量的多种因素的内在关联,辅助以赋权计算的方法,以提高游客流量预测的准确性、科学性和便捷性。
技术领域
本发明涉及计算机数据处理与分析领域,具体涉及一种基于机器学习的游客流量预测方 法。
背景技术
游客流量预测一直是旅游研究中的热点和难点问题,目前主要采用的方法是基于历史游 客流量数据,考虑影响因素赋权法预测游客流量。例如公开号为CN106779247A的发明专利 公开了一种基于熵值法的组合优化旅游需求的预测方法,其根据各项指标观测值所提供的信 息的大小来确定指标权重,并根据次要因素对预测值进行修正;公开号为CN106779196A的 发明专利公开了一种基于旅游大数据的游客流量预测及峰值调控方法,其核心思想也是基于 某些因素赋权来预测游客流量。
影响旅游景区游客流量的因素很多,例如天气、舆情话题、节假日等,而这些因素往往 代表着某种趋势,比方说,天气的变化跟景区四季变化相关,和旅游景区的淡旺季存在着较 强的关联。影响旅游景区游客流量的多方面因素存在着复杂的内部关联,单纯靠穷举式的对 某些因素赋权计算方法,单个因素的影响过大,预测的准确性有待提高。
发明内容
本发明为了解决上述技术问题提供一种基于机器学习的游客流量预测方法。
本发明通过下述技术方案实现:
一种基于机器学习的游客流量预测方法,包括以下步骤:
A、采集旅游景区的历史游客流量数据,并对该数据按年、月、日分类整理;
B、获取上述历史游客流量数据相对应时间段的关联数据,所述关联数据包括最高气温、 最低气温、天气、风向、风力、工作日情况中至少一种,并以天为单位将历史游客流量数据 与关联数据汇总;
C、将关联数据转换为数值并与历史游客流量数据融合;
D、将关联数据、历史游客流量输入学习器中进行训练实现游客流量预测。
本技术方案提出利用机器学习的方法,综合考虑影响旅游景区游客流量的多种因素的内 在关联,辅助以赋权计算的方法,以提高游客流量预测的准确性、科学性和便捷性。
为了进一步提高预测值的准确性,避免异常数据对学习器输出的影响,步骤B中还包括 对异常数据的剔除,该异常数据为历史游客流量数据且该数据低于阈值。
步骤D具体为:
采用随机森林模型分别按年、月、日对旅游景区游客流量进行预测,获得游客流量预测 值,其中,决策字数的数量为275~325棵。
步骤D具体为:
将关联数据、历史游客流量输入随机森林模型、梯度提升树模型、xgboost模型进行基础 学习器的训练,其中,随机森林模型的决策字数的数量为275~325棵;
利用基础学习器的预测结果训练岭回归模型并获得游客流量预测值。
还包括对游客流量预测值的修订步骤,该步骤包括:
E、结合OTA预定数据客流预测值进行修正得到预测值Tk。
步骤E具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都中科大旗软件有限公司,未经成都中科大旗软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810804596.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理