[发明专利]一种基于引用关系分布式表达的论文推荐方法有效

专利信息
申请号: 201710051673.3 申请日: 2017-01-20
公开(公告)号: CN106844665B 公开(公告)日: 2020-05-08
发明(设计)人: 田晗;卓汉逵 申请(专利权)人: 中山大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/38
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 引用 关系 分布式 表达 论文 推荐 方法
【说明书】:

发明公开一种基于引用关系分布式表达的论文推荐方法。利用分布式向量来表达论文在权重引用网络当中的上下文,然后利用该向量计算论文之间的相似度,达到论文推荐的目的。之前的基于引用的论文推荐的方法,都局限于使用论文引用和被引用的论文集合的重合度,对于重合度为0的论文之间无法计算相似度。本发明通过论文之间的权重引用网络,充分利用了论文之间“间接引用”的信息,再使用矩阵分解方法,获得表达论文在引用网络中的位置的分布式向量,使用其内积作为论文之间的相似度表达。该分布式表达可以用来作为学术推荐系统的一种基准特征,能够妥善的解决现有模型存在的问题,并且能够进一步的提高相似度度量的正确性。

技术领域

本发明涉及推荐技术领域,特别是涉及一种基于引用关系分布式表达的论文推荐方法。

背景技术

学术推荐系统作为学术服务的重要一环,已经被引入到很多学术搜索引擎系统当中,比如CiteSeerX,Google Scholar,PubMed等等。通过学术推荐系统,研究者会被推荐与其现有研究论文相关的其他论文,研究者可以检查他们引用资料的完整性,节省搜寻相关工作的人力,快速接触到自己领域的新论文。

推荐系统的本质就是为特定的用户猜测感兴趣的特定的物品并推送。根据推荐基于信息的不同,主要分为基于内容的推荐,基于协同过滤的推荐,社会化推荐和混合模型推荐。在论文的推荐系统当中,存在着一种特殊的基于引用的推荐。论文的引用表示该论文对于前人所做过的工作的系统的调研和追索,包括对其研究课题的整个历史、现状和发展趋势的一个总体的资料集合。引用支持论据有助于增加学术论文的可信度。两篇论文的引用的相似度越高,这两篇论文在课题上,内容上的相似性就越高。随着科研水平的提高,论文的数量与论文之间的引用数量也逐年呈指数式的增长,如何利用论文的引用信息来获得论文推荐的信息,成为一个令学术推荐系统研究者们愈加重视的课题。

现有的基于论文引用信息来提供推荐信息的工作,其中的代表模型有传统的引用预测模型与协同过滤模型,都局限于使用论文引用和被引用的论文集合的重合度,对于重合度为0的论文之间无法计算相似度。同时忽略了论文之间“间接引用”的可用信息。

发明内容

本发明为克服上述现有技术所述的至少一种缺陷,提供一种基于引用关系分布式表达的论文推荐方法。该方法利用论文之间的引用网络,以及分布式向量表达论文在引用网络中的位置,使用内积作为论文之间的相似度表达,达到论文推荐的目的。

为解决上述技术问题,本发明的技术方案如下:

一种基于引用关系分布式表达的论文推荐方法,包括以下步骤:

步骤1:基于所有待研究论文生成ID字典,即为每篇论文赋予一个唯一的索引键,同时利用论文的相互引用关系生成论文引用网络,并建立论文引用权重矩阵M,权重矩阵M是基于论文索引标识构建的n行n列的矩阵;

步骤2:使用最小化代价函数的方法,对权重矩阵M做矩阵分解,将矩阵 M拟合成W*T的形式,其中W是n行m列的矩阵,T是m行n列的矩阵;其中mn,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量来作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达;

步骤3:通过分布式向量之间的内积,计算出两篇论文之间的基于引用的相似度值;

步骤4:对候选论文按照计算出的相似度从大到小排序,得到作为论文推荐的排序列表。

优选的,步骤1中:获取所有待研究论文集合S,生成对应的ID字典,即为每篇论文赋予一个唯一的索引键,索引键用于标识论文,索引键值包括论文的元信息,如论文名称、作者、发表期刊,年份等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710051673.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top