[发明专利]基于主题的个性化研究方向推荐系统和推荐方法有效

专利信息
申请号: 201310396246.0 申请日: 2013-09-04
公开(公告)号: CN103425799A 公开(公告)日: 2013-12-04
发明(设计)人: 卢美莲;高洁;王萌星;秦臻;刘智超 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 夏宪富
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于主题的个性化研究方向推荐系统和推荐方法,该推荐系统能够根据用户阅读的全部论文、以及根据主题模型训练模块进行训练而得到的这些论文的主题,获悉用户所阅读的论文主题以及其对相关论文主题的偏好,从而为用户推荐新的研究方向,以拓宽用户视野。其创新关键是利用用户与论文、论文与主题三者关系构建三层图模型,并依据三层图模型计算用户对主题的偏好值,再得到用户-主题偏好权值矩阵;在权值矩阵基础上,计算用户与其他用户间的相似用户集合。并通过该集合中相似用户的相似度值,以及这些相似用户对各个主题的偏好值,预测该用户对其未涉及主题的偏好程度,并根据预测结果为该用户推荐研究方向(即研究主题)。
搜索关键词: 基于 主题 个性化 研究 方向 推荐 系统 方法
【主权项】:
1.一种基于主题的个性化研究方向推荐系统,其特征在于:所述推荐系统能够根据用户阅读的全部论文、以及根据主题模型训练模块进行训练而得到的这些论文的主题,获悉用户所阅读的论文主题以及其对相关论文主题的偏好,从而为用户推荐新的研究方向,以拓宽用户视野;该推荐系统设有:论文抓取模块、文本预处理模块、主题模型训练模块、三层图模型构建模块、用户-主题偏好权值矩阵计算模块、研究方向推荐模块和数据库;其中:论文抓取模块,负责采用网络爬虫抓取相关学科技术领域中每篇论文的下述信息:包括标题、摘要、关键词、链接地址、作者、所登载的期刊/会议名称、引用数量和发表时间,并将每篇论文使用该论文的链接地址用作其标识加以区分后,将抓取的论文全部信息都存储于数据库;文本预处理模块,负责从数据库中读取每篇论文摘要,并由其分词、词性标注与过滤三个单元依序分别对其进行下述处理:分词单元依据空格、标点符号对论文摘要进行分词,词性标注单元对分词后的论文摘要进行词性标注后,过滤单元提取其中的名词词语,并过滤和删除其中对该论文没有实际意义的停用词,就得到该论文摘要的分词序列,以便提高后续训练和搜索的效率;主题模型训练模块,负责读取文本预处理模块处理后的论文摘要分词序列,并将其作为论文文本执行下述主题模型训练:根据设定的主题个数,利用主题模型对每篇论文文本生成其对应每个主题的主题特征向量、即每篇论文归属于每个主题的分布权值集合,以使每篇论文文本都具有其对应每个主题的特征向量,并以每篇论文文本的标识进行区分;三层图模型构建模块,负责根据从数据库中获取用户全部操作行为记录,以及源自主题模型训练模块的每篇论文归属于每个主题的主题特征向量,构建分别由所有的用户节点、所有的论文节点和所有的主题节点构成的用户层、论文层和主题层的三层图模型;其中,用户层指向论文层的每条有向边表示用户ui对论文pj有包括阅读、收藏、分享、下载和评分的操作行为,而论文层指向主题层的每条有向边则表示论文pj归属于主题tk;再根据三层图模型中对应边的两种权值计算公式计算各层之间的边的权值;该模块设有:论文偏好值计算单元和三层图模型构建单元;用户-主题偏好权值矩阵计算模块,负责依据三层图模型和下述公式计算用户ui对所有论文所涉及的某个主题tk的偏好值:;式中,Aij为用户ui对论文pj的偏好值,Tjk为论文pj属于主题tk的权值;自然数i、j和k分别为用户、论文和主题的序号,且其最大值分别为:I、J和K;研究方向推荐模块,设有顺序连接的相似度计算、主题偏好值计算和研究方向排序三个单元,其中相似度计算单元负责以用户ui对所有论文所涉及的各个主题tk的偏好值作为向量,计算用户ui与其他用户之间的相似度,再根据相似度数值大小对其他用户进行递减排序,并选择位于前列的多个用户作为用户ui的相似用户集合;主题偏好值计算单元依据相似用户集合中的用户相似度值和该集合中的用户us对所有论文所涉及的各个主题tk的偏好值,计算用户ui对其未涉及主题的偏好值;研究方向排序单元再依据用户ui对其未涉及主题的偏好值大小对各个主题进行递减排序,形成初始研究方向推荐列表;再从初始研究方向推荐列表中选择位于前列的若干个研究方向作为用户ui的研究方向推荐列表,并存储于数据库中;数据库,用于存储论文抓取模块抓取的所有论文的全部信息,以及所有用户对存储的论文执行的包括阅读、收藏、分享、下载和评分的全部操作行为记录,每项操作行为记录包括:用户标识、论文标识、具体操作行为和起止时间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310396246.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top