[发明专利]一种基于多层图的论文推荐方法有效
申请号: | 201310706651.8 | 申请日: | 2013-12-19 |
公开(公告)号: | CN103646099A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 戴新宇;潘林林;陈家骏;黄书剑 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 论文 推荐 方法 | ||
技术领域
本发明涉及一种计算机文本挖掘领域,特别是一种计算机论文推荐方法。
背景技术
随着当今世界信息量的急剧增加,以及科研工作的不断取得成果,当今的电子图书馆拥有越来越多的来自各个期刊或者会议的论文。为了更好更快地找到与自己工作相关的论文,人们对论文搜索准确性的需求越来越大。论文推荐就是根据用户的研究方向或者根据用于过往读过的论文为用户推荐一组论文。近年来,对于一个论文推荐任务,一般有三种做法:第一种是基于论文之间的引用信息,根据共同引用的论文数计算论文之间的相关性得分;第二种是基于论文的内容信息,首先把每一个文本都映射到一个高维欧几里得空间,每一维就相当于一个特征,然后为每一维特征计算一个权值,最后使用余弦公式计算向量之间的夹角,即论文之间的相似度;第三种是线性结合论文的引文信息和内容信息,分别计算基于引文信息的得分和基于内容信息的得分,最后将这两种方法的得分线性累加,计算最终的论文相似度得分。而为用户推荐与目标论文相关的论文时,并不能对论文中的词进行简单的匹配,因为论文有很多异构特征,比如:文本、引用、作者、发表期刊等信息。这些异构特征之间可能存在依赖关系,而以往的方法并没有将这些异构特征的依赖关系考虑进来。比如:有些词的表达方式虽然不一样,但是他们其实是相关的,即词与词之间存在依赖关系。表1表示了三篇论文存在的某些词,这三篇论文都是关于机器翻译的。
表1论文词的依赖关系示例
在表1中,论文v1包含词“Statistical Machine Translation”,论文v2包含词“Bilingual Corpora”,论文v3包含词“Statistical Machine Translation”和“Bilingual Corpora”。单纯使用关键词匹配,它们之间没有任何关系,但是从我们人的角度来看这两个都是和机器翻译相关的。如果我们考虑特征之间的依赖关系,可以更好地为用户推荐与之工作相 关的论文。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于多层图的论文推荐方法。
为了解决上述技术问题,本发明公开了一种基于多层图的论文推荐方法,其特征在于,包括以下步骤:
本发明特征在于,包括以下步骤:
步骤一,将目标论文和候选论文作为图中的节点,根据目标论文和候选论文之间以及候选论文彼此之间的引用关系构建论文图;
步骤二,使用词权重计算方法计算词在论文中的权重,剔除权重小于阈值的词,并将剩余的词作为节点,借助语义词典信息构建关键词特征图;
步骤三,根据论文是否包含关键词的信息将论文图与关键词特征图进行组合;
步骤四,使用基于多层图的相似度学习方法列出目标方程;
步骤五,使用图的启发式搜索算法(AO)对目标函数进行优化,更新多层图中边的权重,根据最终多层图的结果进行论文推荐。
本发明步骤一包括以下步骤:
步骤11,将每篇论文作为一个节点,根据目标论文和候选论文之间以及候选论文彼此之间的引用信息构建论文图G0(V,E),V=v1,v2,...,vN,N为论文图G0包含的节点总数,其中vj为论文集中的第j篇论文,当论文vi与论文vj存在引用关系时论文vi与论文vj之间有边连接,i=1,2,...,N,j=1,2,...,N,则判定论文图G0中存在一条边eij,反之,判定论文vi与论文vj之间没有边连接;从而构建论文图,并设置论文图G0中的所有边的初始权重等于1。这里构建的论文图G0是一个无向图,比如论文图G0中若存在一条边eij,那边就会存在另一条边eji,并且边eij与边eji拥有相同的权重。论文图G0中的所有边的初始权重也可以使用论文内容相似度方法进行初始化。
本发明步骤二包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310706651.8/2.html,转载请声明来源钻瓜专利网。