[发明专利]一种基于公开数据的图书推荐的方法有效

专利信息
申请号: 201910066005.7 申请日: 2019-01-24
公开(公告)号: CN109918563B 公开(公告)日: 2023-10-20
发明(设计)人: 王会进;朱蔚恒;龙舜;涂能彬;李田章;黄穗 申请(专利权)人: 暨南大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/0601
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 510632 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于公开数据的图书推荐的方法,具体涉及数字图书馆领域,具体包括以下推荐方法:网上书店书籍数据采集、网上书店能提供信息的书籍的阅读价值评估、馆藏特色书籍数据采集、馆藏特色书籍的阅读价值评估、图书推荐策略以及对外提供图书阅读价值和推荐服务的接口共六个步骤,本发明借助集体智慧的图书推荐技术,通过网络技术不断采集各大网络书店发布的图书销售和推荐信息,根据这些公开数据作为推荐参考标准的思路,集合数量远超一个图书馆的用户的海量用户的阅读体验和智慧,来完成对图书阅读价值的分析,以便向读者推荐最适合的图书,并且可根据图书各类馆藏图书的不同特点和用户的个性化需求提供有针对性的推荐方案。
搜索关键词: 一种 基于 公开 数据 图书 推荐 方法
【主权项】:
1.一种基于公开数据的图书推荐的方法,其特征在于:具体包括以下推荐方法:步骤一、网上书店书籍数据采集,首先,开发网络爬虫,从卓越‑亚马逊、当当一些大型网上书店采集图书数据,根据网上书店所提供的信息构造一个图书之间关联关系的网络,图书间关联的信息包括“买了该书的人还买了…书”、“经常一起购买的…书”、“浏览过该书的人还买过…书”以及用户的星级评价,但不包括读者对图书的具体评价,将这些关联视作一种相互间的推荐关系,这些推荐关系可以形成一张巨大的关联网络,除基本数据之外,采集图书间关联数据,数据经过清洗整理后保存入数据库;步骤二、网上书店能提供信息的书籍的阅读价值评估,基于步骤一中采集的数据,提出一种评估算法(以下称为BookRank算法),根据一本图书的链入和链出的数量和质量来衡量其阅读价值,具体计算每本图书的阅读价值(以下称为BookRank),BookRank算法的核心思路为:每个到该图书的链接都是对它的一次认可投票,1)认可度越高的图书越值得推荐即被认可越多的图书越值得推荐,2)被认可的源图书质量越高,被这些高质量图书所认可的图书也就越值得推荐,一本书被链接的越多意味着被其它图书投票越多,其阅读价值就更高,此时赋予其更高的BookRank值,用于衡量其重要程度即值得推荐的程度;步骤三、馆藏特色书籍数据采集,根据借阅者的身份,以提供信息服务为交换条件从图书馆获得馆藏特色书籍经脱敏后的相关数据,然后通过分析读者行为日志表挖掘图书与读者之间及图书之间的内在关联,具体为预约、借阅以及续借,通过计算图书与读者之间的贡献权值、图书之间的影响度和图书之间的相似支持度来衡量这种关系的密切程度,将获取的特色书籍借阅数据经过清洗整理后保存入数据库;步骤四、馆藏特色书籍的阅读价值评估,基于步骤三中的数据,根据下述原则衡量一本馆藏特色书籍的推荐价值:1)图书与权威越高的读者存在关联行为的次数越多则其推荐价值越高;2)图书与越多读者存在关联行为的次数越多则越值得推荐;3)两图书同时与越多读者同时存在关联行为的读者数量越多则图书间的推荐权值越高;根据借阅者的身份、借阅数量、借阅的其它书籍多个方面对图书的阅读价值进行评估:首先从原始数据中计算不同读者对不同图书类别的影响度,读者A在自己的读者行为日志中,对图书的某类C存在的行为关联关系的次数越多,那么读者A对这个图书类别C比对其它图书类别的影响力更大;如果读者A的身份更专业,更权威,那么读者A对这个图书类别C比对其它读者对这个图书类别C的影响力更大;为了度量不同读者对其有关系的图书所属图书类别的影响程度以及读者身份权威度对图书类别的影响度,引入“读者‑类别”权值;然后计算图书之间的推荐权值,在上一步骤的基础上,如果图书X和图书Y与多个读者同时存在关联关系,那么图书X对图书Y的贡献权值为这些读者对图书Y所属分类的“读者‑类别”权值的加权和;图书X和图书Y之间的相似度为同时与这种图书存在关联关系的读者数量占与图书X、图书Y存在关联关系的读者数量并集的比例;那么图书X对图书Y的推荐权值为图书X对图书Y的贡献权值与图书X和图书Y的相似度的乘积;本发明引入图书之间的推荐权值w(y→x),其中只考虑同时与图书x和y有关联的读者群;步骤五、图书推荐策略,在得到图书的BookRank值的基础上,设计两种图书推荐策略,分别为针对关键词检索的推荐策略和针对某本图书的推荐策略,并将所推荐的图书按BookRank值由高到低排序提供给用户;针对检索关键词的推荐策略:在用户输入关键词进行检索时,系统对检索出来的结果按图书类别的不同对出现的图书类别数量进行分类统计,然后依据结果中各个类别数量的不同,按比例合理分配各个类别的推荐图书数目,并依据BookRank值从这些类别中选择图书,对这些图书进行汇总后按BookRank值排序;针对特定图书的推荐策略:当用户选择某一本图书时,根据该图书的分类信息推荐一定数量的相关图书,思路是:当用户选择某本图书时,意味着该用户感兴趣的图书可能在与所选图书为同一分类的图书类别当中,所以值得推荐的图书应集中在当前类别的图书中,在此将该类别作为选书目录;在图书数据库中,所有图书都按树形结构进行归类,总目录即为总分类,总目录的目录名即为总分类号,作为树形结构的根结点,子目录为中间结点,图书作为叶子结点;这样,在选书目录的叶子数量不足甚至没有时,可以将该选书目录的父目录设为当前选书目录,逐级扩大选书目录,直到选出的图书达到系统规定的推荐数目N为止;所以,在当前分类下图书推荐不足时可以将可推荐的范围扩大至上一级目录,当用户要查找一本图书时,该系统首先会根据用户输入的检索关键词来查找图书,与检索到的结果具有内容相关性的图书再依据特定的排序算法呈现给用户;对外提供图书阅读价值和推荐服务的接口,将图书阅读价值和相关推荐信息保存在后台数据库中,然后通过网络提供对外的一组查询接口,向各图书馆提供相关信息服务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910066005.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top