[发明专利]一种基于海量知识网络的学术社区系统有效
申请号: | 201110405541.9 | 申请日: | 2011-12-08 |
公开(公告)号: | CN102521337A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 金海;赵峰;陈恒;吴步文;方飞;严奉伟;刘普 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海量 知识 网络 学术 社区 系统 | ||
技术领域
本发明属于数据挖掘和信息检索和海量数据处理交叉领域,具体涉及为一种以学术资源搜索、学术数据统计、学术相关服务及学术社区为特色的学术社区系统。
背景技术
随着全球信息化的逐渐发展深入,越来越多的学术资源发布到网络。然而由于这些资源分散在全球各处,既繁多又繁杂,而且还在逐年以指数增长。如何从如此繁多的学术资源中获取想要的资源是一个棘手的问题。
传统的搜索由于面向的是整个互联网,搜索的结果会非常宽泛,不能很好的为科研工作者提供搜索服务。在此背景下产生了专门针对学术资源的搜索。学术搜索专为解决面向学术文献资源的搜索,它的定位不同于通用搜索,而是专注于学术资源的。
然而目前的学术搜索系统有以下问题:1、主要专注于科技文献的搜索,即给出按文献标题的搜索、按作者的搜索等,服务单一,不够丰富和多元化。2、目前大多数的学术搜索系统所索引的科技文献是人工添加的,而非自动从网络中获取的,没有充分利用网络上的丰富资源。3、目前大多数的学术搜索系统对各种学术资源没能整合、没有形成完整的知识网络,以统一对外服务。4、目前的学术搜索系统缺乏与用户的交互,不能充分发挥用户的主动能动性。
这四点都制约了目前的学术搜索的服务,使其不能很好的满足科研工作者各种与学术相关的服务需求。
发明内容
本发明的目的是为了克服现有学术搜索系统的制约,提供了一种基于海量知识网络的学术社区系统,充分利用网络资源形成知识网络,提供了更多的搜索和服务功能以及用户与知识库交互的接口。
一种基于海量知识网络的学术社区系统,包括
信息收集与存储模块9,用于收集网络和用户提供的信息形成知识网络;学术检索模块10,用于在所述知识网络中对会议、文献、作者和领域综述进行检索;学术服务模块11,用于利用所述知识网络服务用户的个性需求;社区模块8,用于用户之间以及用户与知识网络之间的信息交互。
所述信息收集与存储模块9包括公共数据收集模块9.1,用于收集互联网上的学术信息,所述学术信息包括会议、科技文献和作者信息;多个私有数据收集模块9.2,用于收集各对应用户的私有信息和用户分享的学术信息;知识网络组建模块9.3,用于对公共数据模块9.1收集的互联网学术信息和私有数据模块9.2收集的用户分享的学术信息进行整体分析,挖掘出关联关系,形成知识网络。
所述公共数据模块9.1包括会议信息爬取模块9.1A,用于定期的从网络识别和下载包含会议信息的网页;科技文献爬取模块9.1B,用于定期的从网络识别和下载文献列表网页;作者信息爬取模块9.1C,用于定期从网络中识别和下载个人主页;信息抽取和整合模块9.1D,用于从上述三爬取模块爬取的网页中抽取有用信息,并对所述有用信息进行去除冗余、错误数据剔除及信息整合。
所述学术检索模块10包括文献检索模块1,用于定期从知识网络中获取文献信息,接收用户文献查询请求,将文献查询结果按照相似度的高低排序后反馈给用户;会议检索模块2,用于定期从知识网络中获取会议信息,接收用户会议查询请求,将会议查询结果按照会议时间排序后反馈给用户;作者检索模块3,用于定期从知识网络中获取作者信息,接收用户作者查询请求,对作者查询结果进行同名作者区分后反馈给用户;领域综述模块4,用于定期从所述知识网络中获取文献信息,从中抽取文献内容,依据文献内容对文献分类,并计算文献的综合影响分子;接收用户的领域查询请求,确定其所述领域,将确定的领域内的所有文献按照综合影响因子高低排序,选取排序靠前的部分文献进行自然语言分析处理生成综述。
所述学术服务模块11包括格式转换模块5,用于上传用户提供的初稿至所述信息收集与存储模块9,抽取初稿各单元内容,调用用户选定的格式模板对抽取的单元内容作格式转换;自动摘要服务模块6,用于上传用户提供的科技文献至所述信息收集与存储模块9,确定上传的科技文献的文件格式,调用文件格式对应的文献抽取工具抽取其全文信息,依据全文信息生成摘要;投稿推荐服务模块7,用于上传用户的投稿至所述信息收集与存储模块9,从所述知识网络获取会议信息,对所述会议信息进行语义分词,依据分词结果对会议创建索引从而建立会议索引文件,挖掘所述投稿的主题信息,以主题信息作为索引词,所述会议索引文件作为查询源查询出推荐会议反馈给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110405541.9/2.html,转载请声明来源钻瓜专利网。