[发明专利]一种应用于推荐系统的算法及其实现方法无效
申请号: | 201110177698.0 | 申请日: | 2011-06-28 |
公开(公告)号: | CN102855240A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 杨永玲 | 申请(专利权)人: | 上海迈辉信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 推荐 系统 算法 及其 实现 方法 | ||
技术领域
本发明属于互联网计算技术领域。
背景技术
近年来,随着互联网和电子商务的发展,推荐系统得到了广泛的发展。推荐系统的非形式化概念是在1997年由Varian和Resnick提出的“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买的过程”。为了挖掘用户的需求,根据用户的兴趣和爱好推荐他们满意的商品成为了各大电子商务系统的重点。目前,不同形式的推荐系统被应用到了各个领域,如Amazon、EBay为代表的电子商务网站,Netflix、moviefinder为代表的电影网站,songtaste为代表的音乐网站。
推荐算法是整个推荐系统的核心部分,从很大程度上决定了推荐系统的准确性和效率。目前,主流的推荐算法包括基于内容推荐、协同过滤推荐和组合推荐。虽然这些算法都从一定程度上解决了查询专家的问题,但是在应用范围上局限于封闭的机构,所有的数据需要用户或者专家本身去更新,具行较差的维护性;其次,只考虑了专家作为个人的价值,而专家作为知识的载体,在知识的分享和利用的过程中并不是孤立的,他们的人际关系和社会地位也能从一定程度上反映专家与专家之间的差异性;第三,这些系统仅仅是查询系统,列出与查询词匹配的专家,但没有排序功能,缺少推荐性。
因此,需要一个能使推荐系统更具有开放性、推荐性和多指标的推荐算法,在用户查询专家的同时,根据一些因素对查询的结果进行排序,为用户提供更 精准的搜索服务。
发明内容
本发明的目的在于:提供一种应用于推荐系统的算法及其实现方法,实现基于用户偏好的个性化专家推荐,使推荐系统更具有开放性、推荐性和多指标性。
为达到以上目的,本发明采用了主成分分析法,直线型无量纲化方法中的极值法,实现评价专家的三个维度质量指标、结构指标、匹配指标。
进一步,所述的一种应用于专家推荐的推荐算法具有如下特征:
对于质量指标,采用主成分分析法(principal components analysis),对数据进行标准化,判断变量间的相关性,将具有一定相关性的变量根据协方差重新组合成一组新的综合指标,选择不同的累计贡献率大小来确定主成分个数,最终质量指标的因子分析仅包括活跃性因子和互助因子。
对于结构指标,基于网站中搜集的“关注”与“被关注”关系,我们将主要考虑社会网络中三个比较关键的节点:hub结点,bridge结点,Core结点,在结构指标中只需提取一个因子作为专家衡量的依据。
对于匹配指标,选择加法合成法作为专家评价效用函数的公式,将四个因子做了相关性分析和公共因子提取,得出专家效用函数:
U=w1*Y1+w2*Y2+w3*Y3+w4*T4。本发明对专家的匹配基于活跃性因子、互助因子、社会性因子和内容匹配因子,这些因子能全面的反映出专家在某一个维度上的表现水平,是用户在选取专家时可能会考虑的因素。
附图说明
图1是本发明所述的应用于推荐系统的算法的结构指标分析流程。
图2是本发明所述的应用于推荐系统的算法的质量指标分析流程。
具体实施方式
本发明的技术方案说明:
本发明采用了主成分分析法,直线型无量纲化方法中的极值法,实现评价专家的三个维度质量指标、结构指标、匹配指标。
首先根据质量指标(相关性因子Y1,权威性因子Y2,活跃性因子Y3)和结构指标(社会性因子Y4),初步找出专家,然后计算出以上专家的可达指标(可达性因子Y5),最后根据专家及其可达性得出最终推荐专家。
上述各参数指标可由如下数据计算得出:相关性因子Y1,特定会员在特定领域内的发帖数,回帖数可以体现出该会员在该领域内的相关性,Y1=Average([发帖数]+[回帖数]);权威性因子Y2,特定会员在特定领域内的精华帖数,推荐帖数,以及是否为斑竹可以体现出该会员在该领域内的权威性Y2=α*Average([精华帖数]+[推荐帖数])+β*[是否为版主];活跃性因子Y3,特定会员在某时间段(可自定义)内的所有发帖数,回帖数,以及帖子回复总数可以反映出该会员的活跃性Y3=Average([发帖数]+[回帖数]+[帖子回复总数]);社会性因子Y4,由特定会员的好友关系图可以反映出(具体算法待定);可达性因子Y5,特定会员与专家之间的距离(距离超过3以上可以视为关系太远而不在推荐范围之内)。其中Y1,Y2,Y3,Y4的权重系数可由多元线形回归算法获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海迈辉信息技术有限公司,未经上海迈辉信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110177698.0/2.html,转载请声明来源钻瓜专利网。