[发明专利]一种基于主题序列模式的旅游产品推荐方法在审
申请号: | 201910284389.X | 申请日: | 2019-04-10 |
公开(公告)号: | CN110175192A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 王有权;王震;方昌健 | 申请(专利权)人: | 南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/35 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 王路 |
地址: | 210003 江苏省南京市鼓楼区铁路北街*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 旅游产品 主题序列 模式库 挖掘 频繁序列模式 时间序列数据 用户行为模式 存储历史 匹配计算 数据结构 推荐引擎 无缝衔接 序列模式 页面访问 用户实时 语义描述 在线计算 在线旅游 在线匹配 点击流 多叉树 冷启动 准确率 长尾 日志 网站 算法 页面 捕捉 文本 | ||
1.一种基于主题序列模式的旅游产品推荐方法,其特征在于,包括如下步骤:
步骤一、将点击流中的旅游相关页面泛化为主题;
步骤二、从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;
步骤三、提出了一个多叉树数据结构PSC-tree(pattern support candidate-tree)用于存储历史模式库,并与匹配计算模块无缝衔接;
步骤四、提出马尔科夫n-gram模型,完成用户实时点击流与模式库匹配计算。
2.根据权利要求1所述的基于主题序列模式的旅游产品推荐方法,其特征在于,步骤一中,所述主题泛化采用LDA(latent dirichlet allocation)模型降维并过滤噪音,再通过K-Means进行文本聚类实现主题抽取;首先,对线路页面文本信息进行分词、去停用词等预处理操作得到文本向量矩阵;其次,借助LDA模型对所有文本向量矩阵进行主题建模,并采用Gibbs抽样法对建模后的文本向量矩阵进行求解,得到线路页面的隐含主题概率分布矩阵,进而将该矩阵作为K-Means的输入;最终聚类后的每个类簇分别代表线路页面的不同主题I={i1,i2,…,iM}为训练集中所有的页面集合,Т={t1,t2,…,tK}为所有页面泛化后的主题集合,页面主题泛化可以抽象为函数:1≤p≤M,1≤k≤K,其中M表示页面的数量,设K为页面泛化的主题数量,tk表示为页面ip经泛化后的主题。
3.根据权利要求2所述的基于主题序列模式的旅游产品推荐方法,其特征在于,主题抽取方法,其中包括频繁序列模式挖掘和候选产品集生成:
主题访问序列事务集由训练集中所有主题访问序列组成,记为D={D1,D2,…,DU},1≤u≤U,其中U为用户数量,Du表示由连续访问页面组成的访问序列Xu通过主题泛化后得到的主题访问序列;
将主题访问序列事务集D作为Eclat的输入,得到挖掘出的主题频繁时序模式项集,记为P={P1,P2,…,PS},其中S为模式的数量;
抽取每个频繁模式在原始会话中紧跟着的旅游产品页面作为候选项集,其中模式Ps(1≤s≤S)对应的候选集记为CPs,每个模式对应的候选集都是I的子集,最终所有模式对应的候选集记为C={CP1,CP2,…,CPs}。
4.根据权利要求3所述的基于主题序列模式的旅游产品推荐方法,其特征在于,频繁序列模式挖掘方法,其中包括构造一个PSC-tree多叉树存储结构,其结构为:包含一个名为Root的根节点,其余节点为Root节点的孩子节点,每个节点都有2个域,第1个域存储模式的支持度计数,第2个域存储产品候选集,从PSC-tree第2层的每个节点开始,每一个遍历到孩子节点的路径分别代表对应的主题序列模式。
5.根据权利要求1-4任一所述的基于主题序列模式的旅游产品推荐方法,其特征在于,步骤4中,采用条件概率Pr(it|Tp 1)表明用户u购买目标产品的概率,其中条件概率Pr(it|Tp 1)表示给定会话Xu时,用户u对产品it的偏好程度,即:Pr(it|Tp 1)越大表明用户u购买该目标产品的概率越高,假设Pr(it|Tp 1)只与前面n-1个访问页面相关,称为马尔科夫n-gram独立性假设,即:
在马尔科夫n-gram独立性假设之下,上式可以简化为:
此处,Tt=φ(it),对于给定的频繁模式集合,σ(·)为序列或者模式的支持度计数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司,未经南京灵澈信息技术有限公司;云境商务智能研究院南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910284389.X/1.html,转载请声明来源钻瓜专利网。