[发明专利]一种基于ElasticSearch对MOOC课程进行分面检索的方法在审
申请号: | 201611074980.5 | 申请日: | 2016-11-29 |
公开(公告)号: | CN106776878A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 刘均;石磊;魏笔凡;王萌;姚思雨;曾宏伟;郭朝彤;王瑞杰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/20 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 陆万寿 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 elasticsearch mooc 课程 进行 检索 方法 | ||
1.一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,包括以下步骤:
1)元数据的获取:首先从MOOC资源服务平台获取MOOC课程元数据,然后解析数据并将MOOC课程元数据存储在本地资源数据库中;
2)索引构建:首先在ElasticSearch中创建一个索引,然后通过ElasticSearch的批量导入机制,将本地资源数据库中的MOOC课程元数据在ElasticSearch集群中建立索引;
3)多字段检索和字段权重设置:首先根据MOOC课程资源的特点分析出若干个字段的数据并加入到待检索字段中,然后利用ElasticSearch的Bool查询嵌套,实现多字段检索;最后对不同字段通过设置不同的权重,排除检索结果中的干扰信息;
4)分面检索和查询结果排序:首先设置若干个分面,利用ElasticSearch的聚合查询从不同分面对MOOC课程进行筛选和过滤,允许用户创建自己的检索路径,实现分面检索;然后设置排序,在MOOC课程检索结果的基础上按照一个特定分面进行排序,使具有预期属性的MOOC课程尽可能靠前,完成检索结果排序;
5)设置检索服务接口,提供MOOC课程检索服务,检索服务接口要求用户提供检索关键词和检索分面信息,用户提供检索关键词和检索分面信息后,检索服务接口向用户返回MOOC课程信息列表以及课程分面聚合结果。
2.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤1)中元数据的获取具体包括以下步骤:
1.1)通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取课程列表;
1.2)将所有课程的CourseID放入队列中进行循环遍历,根据CourseID这个字段通过基于HTTP协议的GET请求规范从MOOC中国资源服务平台获取每一课程的JSON文件;
1.3)利用JsonPath解析语法,对JSON文件进行解析,获取MOOC课程元数据;
1.4)将MOOC课程元数据存入本地的MySQL资源数据库中。
3.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤2)中索引构建具体包括:首先构建ElasticSearch的Mapping描述文件,指明每一个字段如何索引数据以及是否被检索到,并使用一个默认的分析器Analyzer;然后将Mapping文件写入ElasticSearch集群中,创建一个索引Indexmooc;最后从本地MySQL资源数据库中获取MOOC课程元数据,利用ElasticSearch的Bulk批量导入索引Indexmooc中。
4.根据权利要求1所述的一种基于ElasticSearch对MOOC课程进行分面检索的方法,其特征在于,所述步骤3)中多字段检索和字段权重设置具体包括以下步骤:
3.1)根据MOOC课程资源的特点分析出七个字段的数据,七个字段包括课程名称CourseName、课程简介Introduction、课程机构名称OrgName、章节列表Chapterlist、教师团队TeacherInfo、先修知识Priorknowledge和授课语言Language;
3.2)设置ElasticSearch的查询器TermQuery和MatchQuery,并用ElasticSearch的Bool查询进行嵌套,实现多字段检索;
3.3)设置不同字段的权重,引入权重公式ω=CourseName×1.0+Introduction×ω1+OrgName×ω2+Chapterlist×ω3+TeacherInfo×ω4+Priorknowledge×ω5+Language×ω6;其中MOOC课程名称CourseName的系数为1.0,其他字段系数ω1、ω2、ω3、ω4、ω5和ω6为待定系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611074980.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:摩托车零件型号自动识别方法
- 下一篇:一种客户缴费服务信息推送方法