[发明专利]一种基于高斯估计的在线餐饮主标签数据快速提取方法有效
申请号: | 201610634284.9 | 申请日: | 2016-08-03 |
公开(公告)号: | CN106250522B | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 宣琦;周鸣鸣;张致远;傅晨波;翔云;吴哲夫 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F16/903;G06Q30/02 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于高斯估计的在线餐饮主标签数据快速提取方法,包括以下步骤:1)获取商铺标签数据,以及用户评分与评论数据,并对商铺标签数据进行预处理;2)针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;3)针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;4)将估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩。本发明提取高斯分布下最大似然口味标签作为用户就餐行为的主选口味标签,提取精度较高且算法复杂度较低,适合实际应用场景。 | ||
搜索关键词: | 一种 基于 估计 在线 餐饮 标签 数据 快速 提取 方法 | ||
【主权项】:
1.一种基于高斯估计的在线餐饮主标签数据快速提取方法,其特征在于:所述提取方法包括以下步骤:S1:获取商铺标签数据,以及用户评分与评论数据,对商铺标签数据进行预处理,删除共同标签和无效标签;S2:针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;S3:针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;S4:将上述估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩;所述步骤S1中,需要删除的数据是指那些大多数或所有餐馆都具有的口味标签,以及那些无法明确表达口味信息的标签;所述步骤S2中,计算用户ui的口味高斯分布模型,过程如下:已知该用户去了某些餐馆的历史记录{r1,r2,...,rT},其中rk表示该用户第k次所去的餐馆,表示该餐馆所附属的口味标签,假设该次餐后的用户评分对其各个口味均有效,则关于用户ui的口味fj历史记录均有一组历史打分列表根据此列表数据求得该用户的各口味的评分高斯分布平均值μ与方差σ,记该用户关于口味fj的高斯分布满足所述步骤S3中,预测用户ui第k次去餐馆吃了哪种口味的菜肴,过程如下:定义第k次口味在标准正态分布下的绝对标准差该值越小,说明该口味越能反映该用户对该次用餐行为的客观评价;所以选择最小绝对标准差的口味标签,即最大似然的口味标签作为该用户在第k次用餐的主要口味标签;所述步骤S4根据S3方法提取的用户历史口味估计数据,与S1准备的该用户评论数据作匹配度分析;若该用户的第k次口味标签单词在其第k次评论文本中出现,则记为1,反之为0,求得匹配率;同理,对用户的原始口味历史数据与评论数据分析,求得原始数据集的匹配率,通过比较两者的相对偏差,作为该高斯估计模型的评价指标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610634284.9/,转载请声明来源钻瓜专利网。
- 上一篇:基于三维全息投影的军事地图系统
- 下一篇:一种分布式列存储系统索引的方法