[发明专利]一种基于地理标注照片挖掘的旅游地点情境化推荐方法无效
申请号: | 201210562310.3 | 申请日: | 2012-12-17 |
公开(公告)号: | CN103064924A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 赵江奇;陈亮;陈岭;吕明琪 | 申请(专利权)人: | 浙江鸿程计算机系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 地理 标注 照片 挖掘 旅游 地点 情境 推荐 方法 | ||
技术领域
本发明涉及数据挖掘技术,具体涉及一种基于地理标注照片挖掘的旅游地点情境化推荐方法。
背景技术
个性化推荐是社交网络系统、电子商务系统等提供的最重要的服务之一,是解决用户面对的“信息超载”问题的重要手段。迄今为止,协同过滤是最成功的个性化推荐技术,其基本思想是根据目标用户与其他用户之间的相关性进行推荐,当系统发现一个或一组用户与目标用户具有相似的偏好时,就可根据这些用户的偏好来预测目标用户的偏好。
现有借助群体智慧的协同过滤技术通常通过以下步骤实现个性化推荐:1)待推荐项目准备;2)用户偏好及用户间相似度获取;3)基于用户间相似度的偏好预测。然而,现有协同过滤技术大多面向线上电子商务系统,待推荐项目通常为由电子商务供应商自行设置的线上商品,而用户偏好通常基于其对待推荐项目的评分计算得到。这样的推荐方式难以适应真实世界中的旅游地点推荐,这是由于:1)哪些地点适合旅游通常为用户的主观判断,无法事先准备;2)用户难以对真实世界中的旅游地点进行人工评分;3)用户在不同的时间或天气情境下对旅游地点的选择有所不同。
发明内容
本发明为克服上述不足之处,目的在于提供一种基于地理标注照片挖掘的旅游地点情境化推荐方法,对大量标注了经纬值的地理标注照片进行分析和挖掘,从中发现用户的旅游经验和旅游兴趣,用于个性化和情境化的旅游地点推荐。
本发明通过以下技术方案达到上述目的:一种基于地理标注照片挖掘的旅游地点情境化推荐方法,包括地理标注照片数据挖掘过程和在线旅游地点推荐过程,地理标注照片数据挖掘过程包括以下步骤:
1)获取公开的地理标注照片,把一张地理标注照片看作是一个位置点,对大量地理标注照片进行空间聚类,则得到的每个聚类代表一个热点旅游地点,得到的结果为热点旅游地点集,包括热点旅游地点拍摄的照片集合及其中心点位置;
2)获取旅游地点代表性名称,包括以下步骤:
2.1)获得在该旅游地点拍摄的所有照片的语义标注并构造语义标注集,并基于TF-IDF计算语义标注集中每个语义标注的区分度权值;
2.2)使用Google Places API查询以该旅游地点中心位置为圆心,以指定查询距离为半径范围内的所有地点的名称、位置、地址信息,并构造查询地点集;
2.3)将语义标注集中所有语义标注与查询地点集中所有地点名称进行文本匹配,匹配方法为检查地点名称是否为语义标注的子串,是则匹配,否则不匹配,得到匹配地点集;
2.4)基于匹配结果按以下计算方法确定旅游地点代表性名称:若存在多个匹配,则代表性名称为匹配地点集中离该旅游地点中心距离最近的匹配地点的名称;若只有一个匹配,则代表性名称为该匹配地点的名称;若无匹配,则代表性名称为语义标注集中区分度权值最高的语义标注;
3)建立情境化旅游地点数据库,包括以下步骤:
3.1)对所有用户在热点旅游地点拍摄照片的时间进行时序分析,获取所有用户对每个热点旅游地点的访问信息(包括用户一次访问发生的起始时间和结束时间);
3.2)以每次访问中第一张和最后一张照片拍摄时间的中值作为访问的发生时间,并根据访问发生时间使用天气Web服务查询访问发生时的天气情况,最后获得访问时的时间和天气情境抽象值;
3.3)将属于一个热点旅游地点的所有访问中出现频率最高的时间情境抽象值和天气情境抽象值作为该热点旅游地点适合被访问的时间情境和天气情境,得到情境化旅游地点的位置、代表性名称、适合访问时间情境和适合访问天气情境,并将其加入最终的情境化旅游地点数据库;
4)建立用户偏好模型及用户间相似度模型;
在线旅游地点推荐过程包括以下步骤:
1)用户通过网络提交情境化查询,查询信息包含位置、时间和天气情境;
2)针对用户的查询信息,对旅游地点进行过滤,筛选出情境化旅游地点数据库中满足用户提供情境的所有旅游地点,得到候选旅游地点集;
3)基于用户偏好模型和用户间相似度模型,使用协同过滤方法从候选旅游地点集中提取兴趣度分值最高的若干个旅游地点作为推荐结果。
作为优选,地理标注照片数据挖掘过程步骤1)所述的对大量地理标注照片进行空间聚类使用P-DBSCAN算法。
作为优选,地理标注照片数据挖掘过程步骤1)所述的该旅游地点中心点位置以经纬度表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司,未经浙江鸿程计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210562310.3/2.html,转载请声明来源钻瓜专利网。