[发明专利]一种基于引用关系分布式表达的论文推荐方法有效

专利信息
申请号: 201710051673.3 申请日: 2017-01-20
公开(公告)号: CN106844665B 公开(公告)日: 2020-05-08
发明(设计)人: 田晗;卓汉逵 申请(专利权)人: 中山大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/38
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 引用 关系 分布式 表达 论文 推荐 方法
【权利要求书】:

1.一种基于引用关系分布式表达的论文推荐方法,其特征在于,包括以下步骤:

步骤1:基于所有待研究论文生成ID字典,即为每篇论文赋予一个唯一的索引键,同时利用论文的相互引用关系生成论文引用网络,并建立论文引用权重矩阵M,权重矩阵M是基于论文索引标识构建的n行n列的矩阵;

步骤2:使用最小化代价函数的方法,对权重矩阵M做矩阵分解,将矩阵M拟合成W*T的形式,其中W是n行m列的矩阵,T是m行n列的矩阵;其中m<n,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量来作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达;

步骤3:通过分布式向量之间的内积,计算出两篇论文之间的基于引用的相似度值;

步骤4:对候选论文按照计算出的相似度从大到小排序,得到作为论文推荐的排序列表。

2.如权利要求1所述的方法,其特征在于,步骤1中:获取所有待研究论文集合S,生成对应的ID字典,即为每篇论文赋予一个唯一的索引键,索引键用于标识论文,索引键值包括论文的元信息。

3.如权利要求2所述的方法,其特征在于,步骤1中:使用论文引用的解析器迭代读取各篇论文的引用,与对应在集合S的其他论文建立一致性关联,并且建立无向图,其中每个节点代表论文,节点之间的连线代表两篇论文之间存在引用关系;该无向图即为建立的论文引用网络。

4.如权利要求1或3所述的方法,其特征在于,其中步骤1,由论文引用网络建立n行n列的连接矩阵L,其中Lij为连接矩阵L中的第i行第j列的元素,Lij表示论文i和论文j之间是否存在引用关系,由论文引用网络中对应两点i和j是否存在连线能够得出,当论文在引用网络中对应的两点i和j相互连接时,Lij=1,表示论文i和论文j之间存在引用关系,Lij=0表示论文i和论文j之间不存在引用关系;根据该连接矩阵L生成转移矩阵A;其中转移矩阵A中第i行第j列的元素Aij基于下式确定:

其中Aij表示从节点i随机移动转移到节点j的概率值,n’表示所有待研究论文的数量;矩阵A建立起了有直接引用关系的论文的信息,在此基础上继续构建,获得间接引用的论文之间的联系;

A的t次幂At矩阵的值代表从节点i出发随机移动,在第t步到达节点j的概率,设讨论的步长范围为w时,那么计算生成矩阵其矩阵B中的元素Bij代表从节点i出发随机移动,在w步之内到达节点j的期望次数,其中w为正整数;

构造论文引用权重矩阵M中的元素α为常量,且α+min(log(Bij))>0,即调整M中有值的各项,使之大于0,Mij表示节点i对节点j的权重,Mij越高,表示论文之间的联系愈紧密。

5.如权利要求1所述的方法,其特征在于,其中步骤2,使用SGD随机梯度下降法最小化代价函数其中表示矩阵W的第j列,是矩阵W第i行向量的转置,是一个列向量;通过最优化该代价函数,能够使W*T拟合矩阵M;f(i,j)表示学习权重函数,表示所有节点间的关系对结果的影响程度不同,设为:f(i,j)=Mij;SGD随机梯度下降法是对于J中的加和项的每一项进行迭代,计算梯度,迭代最小化代价函数;采用SGD随机梯度下降法求解该最小化代价函数的无约束最优化问题,得到解

W=[w0,w1,w2,...,wn-1]T

6.如权利要求5所述的方法,其特征在于,其中步骤3:正则化矩阵W中各个节点的分布式向量,再采用公式S(i,j)=wi·wj计算节点i和节点j的相似度S(i,j)的,根据向量夹角计算公式当向量长度正则化为1时,wi·wj的结果越大,在节点i和j的分布式向量之间的角度就越小,两个节点对应的论文就会越相似,反之亦然。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710051673.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top