[发明专利]基于Flickr地理标签元的旅游历史数据获取方法在审
申请号: | 201810343584.0 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108846500A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 罗永龙;陈文;汪逸飞;刘晴晴;俞庆英 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/14;G06F17/30;G06N99/00 |
代理公司: | 芜湖安汇知识产权代理有限公司 34107 | 代理人: | 方文倩 |
地址: | 241000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 照片数据 旅游 预处理 历史数据获取 地理标签 预测区域 删除 旅游信息 旅游需求 拍摄位置 用户标识 用户位置 预测技术 照片标签 重复数据 大数据 下载 筛选 拍摄 预测 | ||
1.一种基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,所述方法包括如下步骤:
S1、下载预测区域的历史Flickr照片数据,Flickr照片数据内含有用户标识及用户位置、照片的拍摄位置及拍摄时间及照片标签;
S2、对所有的Flickr照片数据进行预处理,筛选出预测区域内旅游相关的有效Flickr照片数据,预处理包括依次进行重复数据的删除及旅游无关数据的删除。
2.如权利要求1所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,所述重复数据删除方法具体包括如下步骤:
S11、检测到连续发布相同位置或相邻位置照片的时长大于设定时长,则判定为当地照片,删除对应的Flickr照片数据;
S12、检测到在设定时长内多次发布或一次发布多张相同位置或相邻位置的照片,仅保留最早发布时间的Flickr照片数据,即以最早发布时间作为旅游起始时间。
3.如权利要求1所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,所述与旅游不相关数据删除方法具体包括如下步骤:
S21、删除没有标签值的Flickr照片数据;
S22、利用TF-IDF算法生成聚类簇标签;
S23、利用百度API来提取预测区域内的兴趣点信息;
S24、将每个聚类簇标签与兴趣点信息进行匹配,若聚类簇标签与兴趣信息不匹配,则删除所述聚类簇标签对应的Flickr照片数据。
4.如权利要求1所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,在步骤S2之后还包括:
S3、基于旅游相关的有效Flickr照片数据来获取入境旅游相关的有效Flickr照片数据。
5.如权利要求4所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,所述步骤S3具体包括如下步骤:
S31、检测旅游相关的有效Flickr照片数据中的用户位置是否为空,若检测结果为是,则执行步骤S33、若检测结果为否,则执行步骤S32;
S32、基于用户位置判断是否为入境旅游,删除非入境旅游对应的Flickr照片数据;
S33、基于熵过滤方法进行非入境旅游数据的删除,即信息熵E(u)值大于等于设定阈值,则认定为非入境旅游,删除对应的Flickr照片数据。
6.如权利要求4所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,在步骤S3之后还包括:
S4、针对入境旅游相关的有效Flickr照片数据按月进行入境频率统计,获取预测区域的历史月入境次数,并进行归一化处理;
S5、将归一化后的历史月入境次数输入建立的预测模型,对预测区域的入境旅游流月数据进行预测。
7.如权利要求6所述基于Flickr地理标签元的旅游历史数据获取方法,其特征在于,所述归一化公式具体如下所示:
其中,xi为预测区域某年第i月的入境次数,xmin为预测区域历史月入境次数中的最小值,xmax为预测区域历史月入境次数中的最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343584.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理