[发明专利]一种基于社群分析的学术搜索引擎排序方法有效
申请号: | 201610304112.5 | 申请日: | 2016-05-10 |
公开(公告)号: | CN106021352B | 公开(公告)日: | 2019-04-30 |
发明(设计)人: | 王琦森;李文中;陆桑璐 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/338;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 许丹丹 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于社群分析的学术搜索引擎排序方法,在学术搜索引擎中,基于学术圈内部的著作引用关系和作者合作关系建立二维复杂图模型,将其转化为一维图模型,运用带权重的标记传播方式进行社群分析,将著作信息划分成不同的社群,然后在用户输入所要搜索内容基础上进行社群关系的映射,然后通过基于随机游走过程的排序策略,参考文本相似性和图节点的游走次数对社群内部的内容进行排序,最后得到用户需要的著作集合。本发明方法可以找出学术搜索引擎传统排序方法不能找出的隐藏相关内容,克服传统方法过于依赖文本相似性的缺点,同时该方法的运算需要较少的时间,适用于大型学术搜索引擎排序的场景。 | ||
搜索关键词: | 一种 基于 社群 分析 学术 搜索引擎 排序 方法 | ||
【主权项】:
1.一种基于社群分析的学术搜索引擎排序方法,其特征在于,该方法包括以下步骤:(1)根据著作信息和作者信息确定著作引用关系、著作与作者之间的对应关系以及作者合作关系,并建立二维复杂图模型;(2)将二维复杂图模型转化为以著作信息为图节点,著作引用关系和著作的作者合作关系为权重的一维图模型;(3)在一维图模型的基础上使用带权重的标记传播方式进行社群分析,将图节点划分到规模不同的各个社群中;(4)根据搜索内容进行社群关系的映射,将搜索内容按照文本相似度将所有著作信息进行排序,取前k个图节点,选取这k个图节点所对应的社群中所有图节点,形成图节点集合;(5)对于所述图节点集合中的所有图节点,分别以所述k个图节点作为起始节点通过基于随机游走过程的排序策略确定每个图节点的游走次数,以文本相似性和图节点的游走次数作为著作信息的最终权重对社群内部的著作信息进行排序;(6)选择最终权重排名靠前的若干个著作信息作为搜索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610304112.5/,转载请声明来源钻瓜专利网。