[发明专利]一种基于在线评论和情境感知的餐馆推荐方法有效
申请号: | 201710980537.2 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107545075B | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 林琛;刘杜钢 | 申请(专利权)人: | 厦门大学;厦门大学深圳研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 在线 评论 情境 感知 餐馆 推荐 方法 | ||
1.一种基于在线评论和情境感知的餐馆推荐方法,其特征在于包括以下步骤:
1)从在线评论中训练情境分类模型;所述情境分类模型包括:
克服实际中一个评论带多标签的问题,假设一个评论e最多关联K个标签,则e属于某个标签k的概率为p(l(e)=k)=αpb(k)+(1-α)pe(k),其中是均匀选择概率,pb(k)是该评论e对应的餐馆的所有标签的概率分布,即背景分布,N是该餐馆的评论总数,当N越大时,即评论总数越多时,背景分布pb(k)更可靠,所以权重也应更大;
克服实际中带标签的评论相对于总量的比例特别小的问题,假设同一个餐馆的所有评论分享同样的情境前验分布同一个组别内的用户的所有评论分享同样的情境前验分布其中是一个K维向量,因为每个餐馆至少有一个关联的情境标签,是一个2维向量,因为评论可能没有关联到任何情境标签,综合两者可以得到未带标签的评论的情境分布为:
其中,K+1表示评论不属于任何K个情境之一;
利用数据库中在所有餐馆C+={c}上的带标签评论集合E+和大量的未带标签的评论集合EU,通过最小式(1)训练情境分类模型:
其中,第一项是最大化带标签评论的似然函数,对于所有被归类到情境标签xk的评论,
第二项是最大化采样样本的情境分布和未带标签的评论的情境分布之间的相似度,表示两者之间的KL散度,pc(k|b)表示未带标签的评论的估计情境分布,b是待求参数;第三项是避免过度拟合的正则项;采样过程包括对于情境标签xk的在线评论,按照的概率进行采样;
2)从在线评论中训练特征提取模型;
3)对用户查询进行在线处理,所述在线处理包括以下步骤:
(1)利用情境分类模型得到查询字段的潜在语境;
(2)利用效用量化模型得到该情境下每个餐馆的被选择概率;所述利用效用量化模型得到该情境下每个餐馆的被选择概率步骤包括:
将费用和情境作为用户选择餐馆时的两个最主要因素,则每个餐馆在情境x下的效用盈余表示为:
USx(c)=UCx(c)-UMx(cp)
其中,UC(c)=∑kakck表示用户在餐馆特征上的偏好加权和,即ak是特征ck上的偏好;同样地,UM(cp)=ap(-cp)表示用户在费用上的偏好,综合两者得:
为了便于处理,效用量化模型学习如式(2):
其中,包含用户的所有偏好,c={1,c1...,cK,cp}包含上餐馆的所有特征以及一个常数偏差项,若USx(c)>0,则p(c|x)>0.5,意味着在情境x下,该餐馆C有可能用户选择;
(3)排序概率进行有效推荐。
2.如权利要求1所述一种基于在线评论和情境感知的餐馆推荐方法,其特征在于在步骤1)中,所述在线评论中训练情境分类模型的具体方法为:
情境分类模型从历史的在线评论数据中学习得到一个多类分类器,当用户输入查询字段后根据该分类器快速的推断潜在情境,所述特征提取模型从历史的在线评论数据中学习用户的潜在偏好和餐馆的潜在特征,供后续计算使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学;厦门大学深圳研究院,未经厦门大学;厦门大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710980537.2/1.html,转载请声明来源钻瓜专利网。