[发明专利]一种基于引用关系分布式表达的论文推荐方法有效
申请号: | 201710051673.3 | 申请日: | 2017-01-20 |
公开(公告)号: | CN106844665B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 田晗;卓汉逵 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/38 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 引用 关系 分布式 表达 论文 推荐 方法 | ||
1.一种基于引用关系分布式表达的论文推荐方法,其特征在于,包括以下步骤:
步骤1:基于所有待研究论文生成ID字典,即为每篇论文赋予一个唯一的索引键,同时利用论文的相互引用关系生成论文引用网络,并建立论文引用权重矩阵M,权重矩阵M是基于论文索引标识构建的n行n列的矩阵;
步骤2:使用最小化代价函数的方法,对权重矩阵M做矩阵分解,将矩阵M拟合成W*T的形式,其中W是n行m列的矩阵,T是m行n列的矩阵;其中m<n,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量来作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达;
步骤3:通过分布式向量之间的内积,计算出两篇论文之间的基于引用的相似度值;
步骤4:对候选论文按照计算出的相似度从大到小排序,得到作为论文推荐的排序列表。
2.如权利要求1所述的方法,其特征在于,步骤1中:获取所有待研究论文集合S,生成对应的ID字典,即为每篇论文赋予一个唯一的索引键,索引键用于标识论文,索引键值包括论文的元信息。
3.如权利要求2所述的方法,其特征在于,步骤1中:使用论文引用的解析器迭代读取各篇论文的引用,与对应在集合S的其他论文建立一致性关联,并且建立无向图,其中每个节点代表论文,节点之间的连线代表两篇论文之间存在引用关系;该无向图即为建立的论文引用网络。
4.如权利要求1或3所述的方法,其特征在于,其中步骤1,由论文引用网络建立n行n列的连接矩阵L,其中Lij为连接矩阵L中的第i行第j列的元素,Lij表示论文i和论文j之间是否存在引用关系,由论文引用网络中对应两点i和j是否存在连线能够得出,当论文在引用网络中对应的两点i和j相互连接时,Lij=1,表示论文i和论文j之间存在引用关系,Lij=0表示论文i和论文j之间不存在引用关系;根据该连接矩阵L生成转移矩阵A;其中转移矩阵A中第i行第j列的元素Aij基于下式确定:
其中Aij表示从节点i随机移动转移到节点j的概率值,n’表示所有待研究论文的数量;矩阵A建立起了有直接引用关系的论文的信息,在此基础上继续构建,获得间接引用的论文之间的联系;
A的t次幂At矩阵的值代表从节点i出发随机移动,在第t步到达节点j的概率,设讨论的步长范围为w时,那么计算生成矩阵其矩阵B中的元素Bij代表从节点i出发随机移动,在w步之内到达节点j的期望次数,其中w为正整数;
构造论文引用权重矩阵M中的元素α为常量,且α+min(log(Bij))>0,即调整M中有值的各项,使之大于0,Mij表示节点i对节点j的权重,Mij越高,表示论文之间的联系愈紧密。
5.如权利要求1所述的方法,其特征在于,其中步骤2,使用SGD随机梯度下降法最小化代价函数其中表示矩阵W的第j列,是矩阵W第i行向量的转置,是一个列向量;通过最优化该代价函数,能够使W*T拟合矩阵M;f(i,j)表示学习权重函数,表示所有节点间的关系对结果的影响程度不同,设为:f(i,j)=Mij;SGD随机梯度下降法是对于J中的加和项的每一项进行迭代,计算梯度,迭代最小化代价函数;采用SGD随机梯度下降法求解该最小化代价函数的无约束最优化问题,得到解
W=[w0,w1,w2,...,wn-1]T。
6.如权利要求5所述的方法,其特征在于,其中步骤3:正则化矩阵W中各个节点的分布式向量,再采用公式S(i,j)=wi·wj计算节点i和节点j的相似度S(i,j)的,根据向量夹角计算公式当向量长度正则化为1时,wi·wj的结果越大,在节点i和j的分布式向量之间的角度就越小,两个节点对应的论文就会越相似,反之亦然。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710051673.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:溶液罐恒温装置
- 下一篇:一种具有恒温控制功能的叶黄素储罐