[发明专利]一种基于多层图的论文推荐方法有效
申请号: | 201310706651.8 | 申请日: | 2013-12-19 |
公开(公告)号: | CN103646099A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 戴新宇;潘林林;陈家骏;黄书剑 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 论文 推荐 方法 | ||
1.一种基于多层图的论文推荐方法,其特征在于,包括以下五个步骤:
步骤一,将目标论文和候选论文作为图中的节点,根据目标论文和候选论文之间以及候选论文彼此之间的引用关系构建论文图;
步骤二,使用词权重计算方法计算词在论文中的权重,剔除权重小于阈值的词,并将剩余的词作为节点,借助语义词典信息构建关键词特征图;
步骤三,根据论文是否包含关键词的信息将论文图与关键词特征图进行组合;
步骤四,使用基于多层图的相似度学习方法列出目标方程;
步骤五,使用图的启发式搜索算法对目标函数进行优化,更新多层图中边的权重,根据最终多层图的结果进行论文推荐。
2.根据权利要求1中所述的一种基于多层图的论文推荐方法,其特征在于,步骤一包括以下步骤:
步骤11,将每篇论文作为一个节点,根据目标论文和候选论文之间以及候选论文彼此之间的引用信息构建论文图G0(V,E),V=v1,v2,...,vN,N为论文图G0包含的节点总数,其中vj为论文集中的第j篇论文,当论文vi与论文vj存在引用关系时论文vi与论文vj之间有边连接,i=1,2,...,N,j=1,2,...,N,则判定论文图G0中存在一条边eij,反之,判定论文vi与论文vj之间没有边连接;从而构建论文图,并设置论文图G0中的所有边的初始权重等于1。
3.根据权利要求2所述的一种基于多层图的论文推荐方法,其特征在于,步骤二包括以下步骤:
步骤21,使用一元语法把论文vj表示成特性向量的形式,vj=u1,u2,...,um,其中,每一维表示一个词,m表示论文vj包含的词的总数,uq为论文vj中的第q个词,q=1,2,...,m;
步骤22,根据词权重计算方法的计算公式计算步骤21中每一篇论文中词的权重:
nq,j是第q个词uq在第j篇论文vj中出现的次数,|V|表示目标论文和候选论文的总数,∑pnp,j表示论文vj中所有词在第j篇论文vj中出现的次数总和,p=1,2,...,m;
把论文vj表示成如下形式:vj=(u1,j,u2,j,...,um,j),uq,j表示论文vj的第q个词的权重值;
步骤23,设定阈值ε,与步骤22的结果比较,当uq,j>ε时,词uq作为关键词保留;反之,将词uq从论文vj中剔除;从而最终得到论文集V的关键词集合,并对所有的权重进行归一化;
步骤24,根据语义词典中的词语相似度计算方法的计算公式计算步骤23中关键词之间的相似度权重simLC:
shortest_path(up,uq)表示关键词up和关键词uq在语义词典中的最短路径长度;
步骤25,将步骤23中的每个关键词作为一个节点,根据步骤24的结果构建关键词特征图G1(V,E)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310706651.8/1.html,转载请声明来源钻瓜专利网。