[发明专利]一种电子图书推荐的方法及系统有效
申请号: | 201110430910.X | 申请日: | 2011-12-20 |
公开(公告)号: | CN103176982A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 戴和忠;邱一丰;田原;沈治;斯凌;李玉巍 | 申请(专利权)人: | 中国移动通信集团浙江有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;姜精斌 |
地址: | 310006 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子图书 推荐 方法 系统 | ||
技术领域
本发明涉及文本数据分析技术领域,具体设计一种基于用户社会网络特性的电子图书推荐方法及系统。
背景技术
现有技术中向用户推荐电子图书的方法有多种,以下进行简单说明:
第一种方法是基于用户以往的阅读历史数据,推断用户的阅读偏好,再根据推断出的阅读偏好向用户推荐对应的电子图书。但在该种方法中,对于用户阅读偏好的推断存在一定不足,主要是:由于阅读平台所提供的图书的类别分布不均,且原创类图书较多,通常主要集中在言情、穿越、玄幻等类别;同时由于手机阅读用户的主要用户群是学生、外来务工人员和都市白领,而这一大部分用户访问图书通常集中在言情穿越玄幻等热门分类上,造成系统在对用户偏好进行判定时大部分用户的偏好被判定为热门分类。上述这种情况对于图书推荐造成很多障碍,例如根据系统判断,许多高端商务人士可能被判定为言情或穿越类的阅读偏好,对其进行相应的图书推荐容易引起反感和用户体验下降。
第二种方法:由于仅根据历史数据推断用户的偏好会造成上述问题,因此,现有技术中出现了基于用户身份类型来推断用户的阅读偏好,进而进行相应的图书推荐的方法。但该方法存在如下不足:现有系统主要通过注册用户的年龄、性别、职业特点、产品品牌和手机类型对用户身份进行逆推,而这些基础数据信息在用户注册时由于隐私考虑和技术等种种原因导致数据存在诸多不准确的情况,从而导致用户身份类别判定的准确率非常低,进而造成对于用户偏好的推断存在很大的误差,影响了图书推荐的效果。
可以看出,现有技术中电子图书推荐系统主要是基于用户偏好来进行相应的图书推荐,具体是根据用户访问的历史数据信息或用户身份类型确定用户偏好。但对于访问阅读平台系统较少的用户,可能没有足够的历史数据信息;以及当前系统由于种种限制对于用户身份的判定缺乏可靠的基础,用户类别判定的准确率较低。因而对于用户偏好的推断存在很大的误差。
发明内容
本发明所要解决的技术问题是提供一种电子图书推荐的方法及系统,基于用户在社交行为中的信息分析用户的阅读偏好,进而实现电子图书的推荐。
为解决上述技术问题,本发明提供方案如下:
一种电子图书推荐的方法,包括:
获得待分析用户的关键词词频列表以及关联用户的关键词词频列表,所述关键词词频列表包括有关键词及其对应的词频,所述关键词及其对应的词频是根据用户对不同网站的访问频率,从该用户在不同网站上发布的文本数据中分析得到的,所述关联用户是与所述待分析用户之间存在预定关联关系的用户;
基于待分析用户与关联用户之间的关联程度,确定关联用户的权重,并根据所述权重对多个关联用户的关键词词频列表进行合并,得到合并后的关键词词频列表;
对所述待分析用户的关键词词频列表和所述合并后的关键词词频列表进行汇总,得到所述待分析用户的标签词频列表;
根据所述标签词频列表中的关键词匹配电子图书库中的图书,确定待推荐电子书,并向所述待分析用户推荐。
优选地,上述方法中,进一步按照以下方式,获得对应用户的关键词词频列表:
提取用户在预先选择出的每个网站上发布的文本数据,基于用户在该网站上的文本数据,分析得到用户在该网站的关键词及其对应的词频,其中所述关键词为所述文本数据中满足预设条件的词;
基于所述用户对不同网站的访问频率,对用户在不同网站上的关键词的词频进行加权求和,获得用户的关键词的词频,进而生成该用户的关键词词频列表,其中访问频率较高的网站上的关键词在所述加权求和时具有较高的权重。
优选地,上述方法中,所述基于用户在该网站上的文本数据,分析得到用户在该网站的关键词及其对应的词频,包括:
将每份所述文本数据转换为向量空间模型中的一个向量,所述向量中的每个分量表示为对应的词在所述文本数据中的权值;
统计在所述文本数据中各个词的出现频率,得到各个词的词频;
选取所述权值大于预设第一门限以及所述词频大于预设第二门限的词,作为所述用户在该网站上的关键词,以及统计该关键词在该网站的所有文本数据中的词频之和,得到所述用户在该网站上的该关键词的词频。
优选地,上述方法中,
所述基于待分析用户与关联用户之间的关联程度,确定关联用户的权重,并根据所述权重对多个关联用户的关键词词频列表进行合并,包括:
对所述多个关联用户的关键词词频列表中的关键词求并集,得到合并后的关键词词频列表中的关键词;以及,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团浙江有限公司,未经中国移动通信集团浙江有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110430910.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一步法水果分级筛选装置
- 下一篇:一种气液旋流分离装置