[发明专利]一种基于主题序列模式的旅游产品推荐方法在审
申请号: | 201910284389.X | 申请日: | 2019-04-10 |
公开(公告)号: | CN110175192A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 王有权;王震;方昌健 | 申请(专利权)人: | 南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/35 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 王路 |
地址: | 210003 江苏省南京市鼓楼区铁路北街*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于主题序列模式的旅游产品推荐方法,试图通过在线旅游网站点击日志的挖掘产生推荐列表。首先,从页面语义描述文本中挖掘主题,以在泛化层面捕捉用户行为模式;其次,从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;最后,提出马尔科夫n‑gram模型,完成用户实时点击流与模式库匹配计算,为了提升在线匹配计算的效率,设计一种新的多叉树数据结构PSC‑tree用于存储历史模式库,并与在线计算模块无缝衔接。本发明的SECT推荐引擎,不但在性能上比传统推荐算法更有优势,而且能有效提升冷启动用户和长尾物品的推荐率和准确率。 | ||
搜索关键词: | 旅游产品 主题序列 模式库 挖掘 频繁序列模式 时间序列数据 用户行为模式 存储历史 匹配计算 数据结构 推荐引擎 无缝衔接 序列模式 页面访问 用户实时 语义描述 在线计算 在线旅游 在线匹配 点击流 多叉树 冷启动 准确率 长尾 日志 网站 算法 页面 捕捉 文本 | ||
【主权项】:
1.一种基于主题序列模式的旅游产品推荐方法,其特征在于,包括如下步骤:步骤一、将点击流中的旅游相关页面泛化为主题;步骤二、从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;步骤三、提出了一个多叉树数据结构PSC‑tree(pattern support candidate‑tree)用于存储历史模式库,并与匹配计算模块无缝衔接;步骤四、提出马尔科夫n‑gram模型,完成用户实时点击流与模式库匹配计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司,未经南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910284389.X/,转载请声明来源钻瓜专利网。