[发明专利]一种基于领域专家的推荐系统无效

专利信息
申请号: 201010561661.3 申请日: 2010-11-26
公开(公告)号: CN102479202A 公开(公告)日: 2012-05-30
发明(设计)人: 钟小武;张进军 申请(专利权)人: 卓望数码技术(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市顺天达专利商标代理有限公司 44217 代理人: 李琴
地址: 518057 广东省深圳市南山区高*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 领域 专家 推荐 系统
【说明书】:

技术领域

发明涉及网络服务领域,更具体地说,涉及一种基于领域专家的推荐系统。

背景技术

现在很多推荐系统都采用了协同过滤算法,或者内容过滤算法。协同过滤算法是通过挖掘用户和项目间的隐含关系,向用户推荐其可能感兴趣的项目。内容过滤算法是给定条件,基于项目自身相关属性,把符合条件的项目过滤出来。这两种算法都有自己各自的优缺点:协同过滤算法会有数据稀疏、冷启动、扩展性差、新商品无法被推荐、新用户无法得到推荐商品的问题;基于内容的过滤由于没有挖掘使用项目与项目之间、项目和用户之间的各种关系,所以无法挖掘用户潜在兴趣点,整体的推荐效果不如协同过滤。

有些推荐系统通过综合使用内容和协同过滤来克服当个算法的缺点,提高推荐系统的精准度。使用协同过滤算法基本思想是找出相似的用户或相似的项目,通过相似用户之间产生推荐或者把相似项目推荐给用户。由于原始数据中会包含大量噪点数据,对推荐系统产生不可预知的影响。为了解决噪点数据问题,需要现对原始数据进行预处理。

发明内容

本发明要解决的技术问题在于,针对现有推荐系统的上述推荐精确度不高的缺陷,提供一种基于领域专家的推荐系统。

本发明解决其技术问题所采用的技术方案是:构造一种基于领域专家的推荐系统,在原始数据中挖掘出专家用户,然后查找与当前用户相似度最高的专家用户,从而为当前用户提供该专家用户的相关项目作为推进项目结果集。

本发明提供了一种基于领域专家的推荐系统,包括:

分布式数据库模块,用于保存项目数据、用户数据和用户行为历史数据;

数据挖掘模块,用于根据所述项目数据、用户数据和用户行为历史数据挖掘用户对项目好坏评分、用户感兴趣和潜在兴趣的领域以及专家用户数据;

挖掘结果数据库模块,用于保存所述用户对项目好坏评分、用户感兴趣和潜在兴趣的领域以及专家用户数据;

基于领域评分推荐模块,用于获取用户对项目好坏评分、用户感兴趣和潜在兴趣的领域以及专家用户数据,计算获取临近专家列表,产生临近专家推荐结果集;

对外接口服务层模块,采用网络服务方式为外接访问提供接口,接收用户输入的数据以及将临近专家推荐结果集返回给用户;

数据写入模块,用于将用户输入的项目数据、用户数据和用户行为历史数据写入分布式数据库模块。

在本发明所述的基于领域专家的推荐系统中,所述推荐系统还包括上下文无关评分推荐模块;

所述数据挖掘模块还根据所述项目数据、用户数据和用户行为历史数据挖掘相似项目结果集和关联项目结果集;

所述上下文无关评分推荐模块用于基于相似项目结果集、关联项目结果集,采用基于内容过滤的方法为用户当前行为提供相关和相似产品的推荐结果集;

所述对外接口服务层模块还根据不同时间场合的需要,选择调用接口,从而将临近专家推荐结果集或者相关和相似产品的推荐结果集返回给用户。

在本发明所述的基于领域专家的推荐系统中,所述数据挖掘模块通过用户行为历史数据中用户直接标注的感兴趣领域确定用户感兴趣的领域,根据用户行为历史数据中用户的位置、性别、身份、职业和受教育情况,用户搜索时关键字,以及用户点击、查看和购买项目记录进行综合统计分析及语义分析处理得用户潜在兴趣的领域。

在本发明所述的基于领域专家的推荐系统中,所述数据挖掘模块根据所述用户行为历史数据计算所有用户在各领域内的参与度、影响力和评分偏差,筛选出高于预设的参与度、影响力和评分偏差的用户为专家用户,保存为该领域的专家用户数据。

在本发明所述的基于领域专家的推荐系统中,所述数据挖掘模块还综合用户设置或导入的专家用户资料,保存为专家用户数据。

在本发明所述的基于领域专家的推荐系统中,所述基于领域评分推荐模块,在用户感兴趣和潜在兴趣的领域内,利用用户对项目好坏评分数据采用皮尔逊相关性来计算用户与专家用户的评分相似度,获取临近专家列表。

在本发明所述的基于领域专家的推荐系统中,所述数据挖掘模块采用余弦相似性、修正的余弦相似性和皮尔逊相关性计算项目相似度,产生相似项目结果集。

在本发明所述的基于领域专家的推荐系统中,所述数据挖掘模块采用增量式挖掘方法,计算所有关联项目对出现的次数,找出出现次数最多的预设数量对,作为关联项目结果集。

在本发明所述的基于领域专家的推荐系统中,所述分布式数据库模块按照相关领域自然分类,以项目类别树的方式将各个项目数据作为节点存储。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓望数码技术(深圳)有限公司,未经卓望数码技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010561661.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top