[发明专利]一种基于主题序列模式的旅游产品推荐方法在审
申请号: | 201910284389.X | 申请日: | 2019-04-10 |
公开(公告)号: | CN110175192A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 王有权;王震;方昌健 | 申请(专利权)人: | 南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/35 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 王路 |
地址: | 210003 江苏省南京市鼓楼区铁路北街*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 旅游产品 主题序列 模式库 挖掘 频繁序列模式 时间序列数据 用户行为模式 存储历史 匹配计算 数据结构 推荐引擎 无缝衔接 序列模式 页面访问 用户实时 语义描述 在线计算 在线旅游 在线匹配 点击流 多叉树 冷启动 准确率 长尾 日志 网站 算法 页面 捕捉 文本 | ||
本发明涉及一种基于主题序列模式的旅游产品推荐方法,试图通过在线旅游网站点击日志的挖掘产生推荐列表。首先,从页面语义描述文本中挖掘主题,以在泛化层面捕捉用户行为模式;其次,从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;最后,提出马尔科夫n‑gram模型,完成用户实时点击流与模式库匹配计算,为了提升在线匹配计算的效率,设计一种新的多叉树数据结构PSC‑tree用于存储历史模式库,并与在线计算模块无缝衔接。本发明的SECT推荐引擎,不但在性能上比传统推荐算法更有优势,而且能有效提升冷启动用户和长尾物品的推荐率和准确率。
技术领域
本发明涉及信息科学领域,提供了一种基于主题序列模式的旅游产品推荐方法。
背景技术
近年来,推荐系统领域的研究工作发展迅猛,各种各样的推荐系统亦随之在电子商务、社交网站、电子旅游、互联网广告等大量领域得到了广泛应用,并展示出优越的效果与前景。其中,随着越来越多的在线旅游网站的兴起(如Expedia、Travelzoo、途牛等),能刻画用户旅游兴趣偏好的在线数据越来越丰富,使得旅游产品推荐成为推荐系统研究领域的热门议题之一。
目前,针对传统商品的推荐已有许多成熟的推荐算法得到广泛应用,如协同过滤算法、基于内容的推荐算法和混合型推荐算法等,然而旅游产品推荐与电影、商品等传统推荐有显著差异。首先,用户通常不会频繁或大量购买旅游产品,这导致“用户-产品”关联矩阵极为稀疏;其次,旅游产品描述信息维度多样复杂,微小的参数变化会导致完全不同的旅游产品,如景点参观线路和日程、酒店和交通工具选择等因素的变化,然而这类有内在关联的不同旅游产品却指向用户共同的兴趣偏好;再次,用户往往不会长期关注旅游产品,即在电子旅游网站上留下访问记录,而往往是有了旅游目标和安排之后,才开始浏览旅游产品,这导致在线旅游数据中存在大量冷启动用户。因此,针对传统商品的推荐算法很难直接应用到旅游推荐领域。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明的示例性实施充分利用了在线旅游网站中的点击流数据,研究基于主题序列模式的旅游产品推荐方法。具体而言,本发明首先提出了SECT(sequential recommendation engine for travel products)推荐方法,该方法通过用户实时点击流可以捕捉用户的兴趣偏好,并实时产生旅游产品推荐列表;其次,本发明分别从旅游页面的主题挖掘、访问序列的模式挖掘和模式库的存储、匹配计算等方面对SECT的原理进行了详细的说明。为了提升在线匹配计算的效率,本发明设计一种新的多叉树数据结构PSC-tree用于存储历史模式库,并与在线计算模块无缝衔接。
技术方案:
一种基于主题序列模式的旅游产品推荐方法,包括如下步骤:
步骤一、将点击流中的旅游相关页面泛化为主题;
步骤二、从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;
步骤三、提出了一个多叉树数据结构PSC-tree(pattern support candidate-tree) 用于存储历史模式库,并与匹配计算模块无缝衔接;
步骤四、提出马尔科夫n-gram模型,完成用户实时点击流与模式库匹配计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司,未经南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910284389.X/2.html,转载请声明来源钻瓜专利网。