[发明专利]一种基于谱聚类和众包技术的图书标签推荐方法有效

申请号：	201510270676.7	申请日：	2015-05-26
公开（公告）号：	CN104915388B	公开（公告）日：	2018-03-16
发明（设计）人：	张寅;魏宝刚;尹彦飞	申请（专利权）人：	浙江大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	杭州求是专利事务所有限公司33200	代理人：	邱启旺
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于谱聚类和众包技术的图书标签推荐方法，该方法应用于数字图书馆系统，通过使用用户的检索点击日志构建Laplacian矩阵，并利用谱聚类对检索词进行聚类，之后通过使用众包技术，对聚类的结果进行持续的优化，最后将优化的结果应用于推荐系统中。本发明将用户的检索词作为标签，通过谱聚类和众包技术的结合提升检索词聚类的准确度，从而提高系统在标签推荐方面的准确性。
搜索关键词：	一种基于谱聚类技术图书标签推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于谱聚类和众包技术的图书标签推荐方法，其特征在于，包括以下步骤：(1)从日志收集系统或者Web日志中筛选出用户的检索数据和检索点击数据；(2)利用用户的检索数据和检索点击数据，构建检索词‑图书矩阵，根据检索词‑图书矩阵得到检索词‑检索词的Laplacian矩阵；具体为：从用户的检索数据中得到所有用户的检索词集合Q＝{q1,q2,…,qn}，其中n为检索词的总数，q为独立检索词；从用户的检索点击数据中得到检索词点击的图书集合B＝{b1,b2,…,bm}，其中m为点击图书的总数，b为独立的图书；根据所有用户的检索词集合Q和检索词点击的图书集合B得到检索词‑图书矩阵M，对于检索词‑图书矩阵M的每一项，定义如下：其中Iij为第i个检索词和第j本书的对应关系；针对每一本图书，如果有多个检索词均对这本书存在点击行为，那么这些检索词之间存在联系，根据检索词之间的联系构建检索词‑检索词矩阵D，对于检索词‑检索词矩阵D的每一项，如果两个检索词之间存在联系则为1，否则为0；通过把检索词‑检索词矩阵D的每一列元素相加得到的值置于对角线上，其它位置设为0，从而构成新的矩阵W；Laplacian矩阵L通过公式L＝D‑W求出；(3)使用谱聚类对Laplacian矩阵进行聚类操作，得到检索词的聚类结果；(4)利用众包技术对步骤3所得到的聚类结果进行持续的优化；(5)将用户过去的检索记录与步骤4优化后的聚类结果进行映射，利用映射后的聚类结构作为标签推荐给用户。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510270676.7/，转载请声明来源钻瓜专利网。

上一篇：高炉冲渣水余热解冻原料场冬季进场原料的装置和方法
下一篇：使用多个发送线圈进行无线电力输送的方法和设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于谱聚类和众包技术的图书标签推荐方法有效

专利文献下载