[发明专利]一种主题自适应的学术会议搜索系统有效
申请号: | 201310003000.2 | 申请日: | 2013-01-05 |
公开(公告)号: | CN103049575A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 金海;赵峰;孙正;聂昶 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种主题自适应的学术会议搜索系统,包括数据采集模块、主题发现模块以及数据处理模块,数据采集模块包括网络爬虫子模块和数据存储子模块,主题发现模块包括网页信息抽取子模块、文本抽取子模块以及文本挖掘子模块,数据处理模块包括数据库子模块、索引子模块、学术会议评价子模块以及检索子模块,网络爬虫子模块用于从公开免费的信息源爬取包含学术会议和/或期刊信息的网页,数据存储子模块用于将网络爬虫子模块爬取的网页以文件的形式存储在本地,网页信息抽取子模块用于从爬取的网页中抽取出学术会议和/或期刊的信息并存储在文件中。本发明可根据关键词进行主题自适应的相关性判定过程,并具有很强的专业性、高精确性和权威性。 | ||
搜索关键词: | 一种 主题 自适应 学术会议 搜索 系统 | ||
【主权项】:
一种主题自适应的学术会议搜索系统,包括数据采集模块、主题发现模块、数据处理模块以及用户接口模块,其特征在于,用户接口模块包括学术会议搜索接口子模块以及个性化投稿推荐接口子模块;数据采集模块包括网络爬虫子模块和数据存储子模块;主题发现模块包括网页信息抽取子模块、文本抽取子模块以及文本挖掘子模块;数据处理模块包括数据库子模块、索引子模块、学术会议评价子模块以及检索子模块;网络爬虫子模块用于从公开免费的信息源爬取包含学术会议和/或期刊信息的网页;数据存储子模块用于将网络爬虫子模块爬取的网页以文件的形式存储在本地;网页信息抽取子模块用于从爬取的网页中抽取出学术会议和/或期刊的信息并存储在文件中;个性化投稿推荐接口子模块用于接收用户上传的论文文档,并将其传递给文本抽取子模块;文本抽取子模块用于解析来自个性化投稿推荐接口子模块的论文文档,以获取文档内容的文本信息,并将文本信息传递给文本挖掘子模块;文本挖掘子模块用于对文本抽取子模块获取的文本信息进行文本挖掘,以获取主题信息,并将主题信息传给检索子模块;数据库子模块用于将网页信息抽取子模块抽取到的学术会议和/或期刊信息存储到数据库中;索引子模块用于利用开源全文检索引擎工具包为存储在数据库中的学 术会议和/或期刊信息构建索引;学术会议评价子模块用于计算学术会议和/或期刊的等级值;学术会议搜索接口子模块用于接收用户输入的搜索关键词,并将其传递给检索子模块;检索子模块用于从学术会议搜索接口子模块接收搜索关键词,利用开源全文检索引擎工具包对该搜索关键词进行解析,根据解析结果在索引子模块构建的索引中进行检索以获取对应的学术会议和/或期刊信息作为检索结果,根据学术会议评价子模块计算的等级值对检索结果进行排序,并将排序结果传送给学术会议搜索接口子模块;检索子模块还用于接收来自文本挖掘子模块的主题信息,利用开源全文检索引擎工具包对该主题信息进行解析,根据解析结果在索引子模块构建的索引中进行检索以获取对应的学术会议和/或期刊信息作为检索结果,根据学术会议评价子模块计算的等级值对检索结果进行排序,并将排序结果传送给个性化投稿推荐接口子模块;学术会议搜索接口子模块还用于将来自于检索子模块的排序结果以可视化的形式呈现在Web页面上,供用户查阅;个性化投稿推荐接口子模块还用于将来自于检索子模块的排序结果以可视化的形式呈现在Web页面上,供用户查阅。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310003000.2/,转载请声明来源钻瓜专利网。
- 上一篇:物流信息追踪装置
- 下一篇:一种手持式物流收件信息采集装置