[发明专利]一种基于书评的书籍推荐方法及系统在审
申请号: | 201910109797.1 | 申请日: | 2019-02-11 |
公开(公告)号: | CN109885766A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 邱奇志;李葭;陈睿;赵冬瑜 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 书籍 标签模型 特征描述 关联度 语料库 三层神经网络 大型语料库 机器学习 计量分析 特征维度 维基百科 研究对象 语言特征 语义内容 词向量 算法 词语 全集 标签 学习 中文 改进 探索 | ||
本发明公开了一种基于书评的书籍推荐方法及系统,本发明以每一本书的书评全集作为研究对象,从书评内容的语言特征、语义内容等多个特征维度来探索这本书所的属性,通过深度学习方法计算词语之间的关联度,为书籍打上基于书评的标签,并结合机器学习与计量分析方法,设计可行的面向特征描述的标签模型;同时通过深度学习方法,使用中文维基百科语料库或其他新闻语料库,训练面向特征描述的词向量模型,在大型语料库中使用改进的word2vec三层神经网络计算书籍标签模型之间的距离,从而得到书籍之间的关联度,实现精准的基于书评的书籍推荐算法。
技术领域
本发明属于计算机技术领域,涉及一种书籍推荐方法及系统,具体涉及一种基于书评的书籍推荐方法及系统。
背景技术
信息碎片化、膨胀化的今日,众生疲命,书籍成为了快节奏生活中灵魂栖息的孤岛。尽管阅读本身是一件相对独立的行为,但近年来线上读书社区如雨后春笋般出现,读者选书趣味和阅读分享日益受到社交平台的影响。
新华网调查显示,78%的受访者选择通过社交平台(微信、微博、豆瓣、知乎等)分享阅读有关的内容,17%的受访者会在电商平台留下读者书评。网络书评的数量在飞速增加。
书评是文化的筛子,镜子和轮子。盛大文学曾重金悬赏“白金评书人”,也正是基于“百分之八十以上的读者在选择读物时有参考书评人意见的习惯”的网络调查,可以看到网络书评对网络用户的阅读有着一定的参考意义且表现出重要价值。在电子商务领域的相关研究中,一般认为网络书评是电子口碑(eWOM)的一种形式,这也体现了网络书评具有商业性的潜质。一些学者在网络书评领域已经做出了独创性的微观研究,也证实了书评质量对图书销量有显著影响。近几年来,网络书评的迅速发展正在悄然改变着人们看待书评的态度和利用书评的方式:为了迎合需求,多数线上商家,如当当网、亚马逊都已经构建了自己的网络书评平台和相应机制。网络书评的地位日渐上升。
然而,已存在的书评基数太大,读者无法短时间内悉数尽读。网络书评发布者并不是专业的书评工作者,因此造成书评冗余繁杂,让读者无从下手。如何从成百上千条书评中得到一个客观的认知,成为了读者的一大难题。此外,极易与商业利益挂钩的网络书评之中是否存在着大量无用信息?怎样短时间从书评中提取书籍属性相关信息,成为现在需要面对的问题。同时,目前已存在的书籍推荐系统大多数都使用基于用户的协同过滤算实现推荐,即基于用户的收藏情况进行推荐。这种方式具有的局限性在于其“从众性”,即假设大部分人收藏了A的同时收藏了B,则在你收藏了A后,推荐系统就会为你推荐B。因为其推荐的根基是“其他用户的收藏情况”,而非与书籍本身相关的属性,所以得到的结果只会是“大众水平”。这种方式推荐的书籍在上往往不够精确。
发明内容
为了解决上述技术问题,本发明以每一本书的书评全集作为研究对象,从书评内容的语言特征、语义内容等多个特征维度来探索这本书所的属性,通过深度学习方法计算词语之间的关联度,为书籍打上基于书评的标签,并结合机器学习与计量分析方法,设计可行的面向特征描述的标签模型;同时通过深度学习方法,使用中文维基百科语料库或其他新闻语料库,训练面向特征描述的词向量模型,在大型语料库中使用改进的word2vec三层神经网络计算书籍标签模型之间的距离,从而得到书籍之间的关联度,实现精准的基于书评的书籍推荐算法。
本发明的方法所采用的技术方案是:一种基于书评的书籍推荐方法,其特征在于,包括以下步骤:
步骤1:从目标网站爬取相应书籍的书评并建立数据库保存数据;
步骤2:建立书籍书评标签集;
步骤3:建立自然语言标签库;
步骤4:计算书籍书评标签集之间关联度;
步骤5:根据关联度排名高低进行书籍推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910109797.1/2.html,转载请声明来源钻瓜专利网。