[发明专利]基于Flickr地理标签元的旅游历史数据获取方法在审
申请号: | 201810343584.0 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108846500A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 罗永龙;陈文;汪逸飞;刘晴晴;俞庆英 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/14;G06F17/30;G06N99/00 |
代理公司: | 芜湖安汇知识产权代理有限公司 34107 | 代理人: | 方文倩 |
地址: | 241000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 照片数据 旅游 预处理 历史数据获取 地理标签 预测区域 删除 旅游信息 旅游需求 拍摄位置 用户标识 用户位置 预测技术 照片标签 重复数据 大数据 下载 筛选 拍摄 预测 | ||
本发明适用于大数据的旅游预测技术领域,提供了一种基于Flickr地理标签元的旅游历史数据获取方法,该方法包括如下步骤:S1、下载预测区域的历史Flickr照片数据,Flickr照片数据内含有用户标识及用户位置、照片的拍摄位置及拍摄时间及照片标签;S2、对所有的Flickr照片数据进行预处理,筛选出预测区域内旅游相关的有效Flickr照片数据,预处理包括依次进行重复数据的删除及旅游无关数据的删除。本发明实施例基于Flickr照片数据来获取旅游信息较差地区的历史旅游数据,以便基于历史旅游数据来预测该地区的旅游需求。
技术领域
本发明属于大数据的旅游预测技术领域,提供了一种基于Flickr地理标签元的旅游历史数据获取方法。
背景技术
旅游预测是旅游经济分析与战略规划中的一个关键问题,一般方法都是通过历史数据统计预测传统旅游需求。传统的旅游预测研究主要是基于官方发布的统计年鉴,而这些年鉴更新缓慢,尤其在旅游信息化较差的地方,例如一些发展中国家或某国家的偏远地区,旅游资料普遍缺失,如何获取此类地区的历史旅游数据成为旅游预测中迫切需要解决问题。
发明内容
本发明实施例提供了一种基于Flickr地理标签元的旅游历史数据获取方法,旨在获取旅游信息较差地区的历史旅游数据。
本发明是这样实现的,一种基于Flickr地理标签元的旅游历史数据获取方法,该方法包括如下步骤:
S1、下载预测区域的历史Flickr照片数据,Flickr照片数据内含有用户标识及用户位置、照片的拍摄位置及拍摄时间及照片标签;
S2、对所有的Flickr照片数据进行预处理,筛选出预测区域内旅游相关的有效Flickr照片数据,预处理包括依次进行重复数据的删除及旅游无关数据的删除。
进一步的,所述重复数据删除方法具体包括如下步骤:
S11、检测到连续发布相同位置或相邻位置照片的时长大于设定时长,则判定为当地照片,删除对应的Flickr照片数据;
S12、检测到在设定时长内多次发布或一次发布多张相同位置或相邻位置的照片,仅保留最早发布时间的Flickr照片数据,即以最早发布时间作为旅游起始时间。
进一步的,所述与旅游不相关数据删除方法具体包括如下步骤:
S21、删除没有标签值的Flickr照片数据;
S22、利用TF-IDF算法生成聚类簇标签;
S23、利用百度API来提取预测区域内的兴趣点信息;
S24、将每个聚类簇标签与兴趣点信息进行匹配,若聚类簇标签与兴趣信息不匹配,则删除所述聚类簇标签对应的Flickr照片数据。
进一步的,在步骤S2之后还包括:
S3、基于旅游相关的有效Flickr照片数据来获取入境旅游相关的有效Flickr 照片数据。
进一步的,所述步骤S3具体包括如下步骤:
S31、检测旅游相关的有效Flickr照片数据中的用户位置是否为空,若检测结果为是,则执行步骤S33、若检测结果为否,则执行步骤S32;
S32、基于用户位置判断是否为入境旅游,删除非入境旅游对应的Flickr 照片数据;
S33、基于熵过滤方法进行非入境旅游数据的删除,即信息熵E(u)值大于等于设定阈值,则认定为非入境旅游,删除对应的Flickr照片数据。
进一步的,在步骤S3之后还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343584.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理