[发明专利]基于Flickr地理标签元的旅游历史数据获取方法在审

专利信息
申请号: 201810343584.0 申请日: 2018-04-17
公开(公告)号: CN108846500A 公开(公告)日: 2018-11-20
发明(设计)人: 罗永龙;陈文;汪逸飞;刘晴晴;俞庆英 申请(专利权)人: 安徽师范大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/14;G06F17/30;G06N99/00
代理公司: 芜湖安汇知识产权代理有限公司 34107 代理人: 方文倩
地址: 241000 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 照片数据 旅游 预处理 历史数据获取 地理标签 预测区域 删除 旅游信息 旅游需求 拍摄位置 用户标识 用户位置 预测技术 照片标签 重复数据 大数据 下载 筛选 拍摄 预测
【说明书】:

发明适用于大数据的旅游预测技术领域,提供了一种基于Flickr地理标签元的旅游历史数据获取方法,该方法包括如下步骤:S1、下载预测区域的历史Flickr照片数据,Flickr照片数据内含有用户标识及用户位置、照片的拍摄位置及拍摄时间及照片标签;S2、对所有的Flickr照片数据进行预处理,筛选出预测区域内旅游相关的有效Flickr照片数据,预处理包括依次进行重复数据的删除及旅游无关数据的删除。本发明实施例基于Flickr照片数据来获取旅游信息较差地区的历史旅游数据,以便基于历史旅游数据来预测该地区的旅游需求。

技术领域

本发明属于大数据的旅游预测技术领域,提供了一种基于Flickr地理标签元的旅游历史数据获取方法。

背景技术

旅游预测是旅游经济分析与战略规划中的一个关键问题,一般方法都是通过历史数据统计预测传统旅游需求。传统的旅游预测研究主要是基于官方发布的统计年鉴,而这些年鉴更新缓慢,尤其在旅游信息化较差的地方,例如一些发展中国家或某国家的偏远地区,旅游资料普遍缺失,如何获取此类地区的历史旅游数据成为旅游预测中迫切需要解决问题。

发明内容

本发明实施例提供了一种基于Flickr地理标签元的旅游历史数据获取方法,旨在获取旅游信息较差地区的历史旅游数据。

本发明是这样实现的,一种基于Flickr地理标签元的旅游历史数据获取方法,该方法包括如下步骤:

S1、下载预测区域的历史Flickr照片数据,Flickr照片数据内含有用户标识及用户位置、照片的拍摄位置及拍摄时间及照片标签;

S2、对所有的Flickr照片数据进行预处理,筛选出预测区域内旅游相关的有效Flickr照片数据,预处理包括依次进行重复数据的删除及旅游无关数据的删除。

进一步的,所述重复数据删除方法具体包括如下步骤:

S11、检测到连续发布相同位置或相邻位置照片的时长大于设定时长,则判定为当地照片,删除对应的Flickr照片数据;

S12、检测到在设定时长内多次发布或一次发布多张相同位置或相邻位置的照片,仅保留最早发布时间的Flickr照片数据,即以最早发布时间作为旅游起始时间。

进一步的,所述与旅游不相关数据删除方法具体包括如下步骤:

S21、删除没有标签值的Flickr照片数据;

S22、利用TF-IDF算法生成聚类簇标签;

S23、利用百度API来提取预测区域内的兴趣点信息;

S24、将每个聚类簇标签与兴趣点信息进行匹配,若聚类簇标签与兴趣信息不匹配,则删除所述聚类簇标签对应的Flickr照片数据。

进一步的,在步骤S2之后还包括:

S3、基于旅游相关的有效Flickr照片数据来获取入境旅游相关的有效Flickr 照片数据。

进一步的,所述步骤S3具体包括如下步骤:

S31、检测旅游相关的有效Flickr照片数据中的用户位置是否为空,若检测结果为是,则执行步骤S33、若检测结果为否,则执行步骤S32;

S32、基于用户位置判断是否为入境旅游,删除非入境旅游对应的Flickr 照片数据;

S33、基于熵过滤方法进行非入境旅游数据的删除,即信息熵E(u)值大于等于设定阈值,则认定为非入境旅游,删除对应的Flickr照片数据。

进一步的,在步骤S3之后还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810343584.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top