[发明专利]一种基于人口属性关键字向量的协作过滤推荐方法有效
申请号: | 200910045655.X | 申请日: | 2009-01-21 |
公开(公告)号: | CN101489107A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 贺樑;顾君忠;邓双义;夏薇薇;陈天;任磊;何克勤;杨燕;林欣;马天龙 | 申请(专利权)人: | 华东师范大学 |
主分类号: | H04N7/173 | 分类号: | H04N7/173;H04N5/44 |
代理公司: | 上海蓝迪专利事务所 | 代理人: | 徐筱梅 |
地址: | 200062上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人口 属性 关键字 向量 协作 过滤 推荐 方法 | ||
技术领域
本发明涉及IPTV个性化推荐系统,具体地说是一种基于人口属性关键字向量的协作过滤推荐方法。
背景技术
随着Internet上信息的剧增出现了所谓的“信息过载”和“信息迷向”现象,推荐系统应运而生,他能根据用户操作历史和反馈等信息为用户找到适合其兴趣的资源,为其产生个性化的推荐。如今,推荐技术已经应用在电子商务、数字图书馆、影视娱乐等各个领域。尤其是IPTV领域,随着数字电视和通信技术的不断发展,电视节目资源越来越丰富,一方面用户为能够收看到如此之多的节目而感到兴奋不已,另一方面又为如何从成百上千个节目中找到他们真正喜爱的节目,而感到苦恼。协作过滤技术是当前最成功的个性化推荐技术,一些比较有名的推荐系统如WebWatcher、GroupLens、Firefly、SELECT、LileMinds和Citeseer都采用了协作过滤的方法。基本思想就是基于评分相似的最近邻居的评分数据向目标用户产生推荐,即根据其他用户的观点产生对目标用户的推荐列表。它基于这样一个假设:如果用户对一些项目的评分比较相似,则他们对其他项目的评分也比较相似。其出发点是找到与你兴趣相同的一组用户,术语叫做“最近邻”。最近邻搜索的核心是计算两个用户的相似度。例如用户A和用户B,首先需要获取用户A和用户B所有的评分项,然后选择一个合适的相似度计算方法,基于评分项数据,计算得到用户A和用户B的相似度数值。以上三种类型的推荐系统各有其优缺点,但所有的推荐系统均面临一个共同的问题,即冷启动问题。即传统的协作过滤算法均要求用户已对一部分项目进行过评分,当无评分或者评分非常少的时候,系统则无法产生推荐或者推荐的精度非常差。
发明内容
本发明的目的是针对现有技术的不足而设计的一种基于人口属性关键字向量依据人口属性状况建立人口属性向量,这些人口属性状况包括年龄、性别、民族、职业、收入状况、爱好、自我描述等一系列用户在注册时给定的信息。人口属性向量为一关键字集,之后根据每个用户的属性向量集计算两用户之间的相似度,并同传统推荐算法计算出的相似度混合,之后选择出跟目标邻居最相似的若干个用户,然后综合这些用户的评分来预测用户未评分的项目,最后产生推荐。这种方法能在系统冷启动阶段很好的为用户提供推荐。
本发明的目的是这样实现的:
一种引入基于人口属性关键字向量的协作过滤推荐方法,特点是IPTV节目的界面上,提供用户评分的可视化菜单,并根据终端机项盒传来的用户观看时间、行为操作、节目评分数据作出节目推荐列表给目标用户,其具体步骤如下:
a)、收集用户人口属性信息和自我描述信息;
b)、收集用户对项目的评分数据形成用户-项目评分矩阵A(m,n);
c)、使用中文分词技术和关键字匹配寻找每个用户所拥有的关键字集合;
d)、计算目标用户和其他用户之间的关键字集合之间的交集;
e)、计算目标用户和其他用户之间的共同评分项目;
f)、根据d、e步骤的结果计算出目标用户和其他用户之间的相似度;
g)、选取相似度最大的K个用户作为其最近邻居集;
h)、根据最近邻居集对目标用户未评分项目来预测评分并排序;
i)、将预测评分最大的前N个项目作出推荐列表给目标用户。
所述“用户-项目”评分矩阵A(m,n),以用户评分信息和用户行为数据进行矩阵排列,行代表用户,列代表项目,矩阵中的元素值则代表该行用户对该列项目的喜爱程度。
所述使用中文分词技术和关键字匹配寻找每个用户所拥有的关键字集合是在用户每次注册以及更新个人信息时使用。
所述目标用户和其他用户间的相似度是根据人口属性相似度和用户评分相似度混合后共同计算得到的。
本发明能够有效解决以往推荐系统所存在的无法对新用户产生推荐的问题,并能很好的提高对评分稀疏的用户的推荐精度。
附图说明
图1为本发明系统架构图
图2为本发明所使用的基于人口属性关键字向量的协作过滤推荐算法流程图
具体实施方式
实施例
参阅附图1~2,本发明在IPTV节目的界面上,提供用户评分的可视化菜单,并根据终端机顶盒传来的用户观看时间、行为操作、节目评分数据作出节目推荐列表给目标用户,其具体步骤如下:
(1)、数据收集部件在IPTV系统中通过跟踪用户的观看时间、行为操作等特征来获取代表用户兴趣的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910045655.X/2.html,转载请声明来源钻瓜专利网。