[发明专利]用于网络教学系统的知识自动提取方法及装置有效
申请号: | 201410625252.3 | 申请日: | 2014-11-07 |
公开(公告)号: | CN105608067B | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 王肃;郑骏;陈志云;胡文心;王明亚 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/284;G09B5/02 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 网络 教学 系统 知识 自动 提取 方法 装置 | ||
本发明涉及一种用于网络教学系统的知识自动提取方法及装置,所述方法包括:建立知识库,该知识库存储有所述网络教学系统相关课程的所有知识点;接收教学文档,对所述教学文档进行预处理,将教学文档转化为提取源文件;知识库中的知识点作为所述教学文档的候选知识点,对每条候选知识点进行分词处理,提取各候选知识点的知识词元;根据所述知识词元计算并调整每条候选知识点在提取源文件中的信用度;计算候选知识点的信用度阈值;判断各候选知识点的信用度是否大于或者等于所述信用度阈值,若是,则将对应的知识点作为所述教学文档的关联知识输出。与现有技术相比,本发明具有可以有效地提取出教学文档中的知识、查准率高等优点。
技术领域
本发明涉及计算机科学技术领域,尤其是涉及一种用于网络教学系统的知识自动提取方法及装置。
背景技术
随着信息技术的飞速发展,越来越多的网络教学系统产生。目前的网络教学系统主要功能包括在线课件演示、在线作业、在线考试、在线视频教学等功能。其中老师上传课件和相关文档供学生学习和分享是其中的一个重要功能,几乎所有的网络教学系统都具有该功能。
但是随着上传的课件和文档越来越多,学生想要找到自己所需的文档将会花费更多的时间。目前,很多学习系统都是对文件进行关键词提取,便于学生查询和浏览所需用的资源。但是简单的关键词并不能准确的表述课件和教学文档的内容。大多数和课程相关的课件及文件都是和该课程的教学知识点相关的,知识点是由多个词语组成的短句,它可以准确、系统地表述课件或资源文件的主要学习内容,方便用户找到所需课件,并且有利于学生学习,这些都是关键词做不到的。
目前,现有的网络教学系统中很少具有教学文档的知识自动提取功能。知识点大多是由上传课件和文档的教师手工输入,或者从系统已有的知识点库中选择。但是这种方式存在着问题,知识点可能存在输入错误,不一致等问题。因此,在网络教学系统中,对上传的教学课件及其他相关文档自动提取知识点是一项非常必要并且重要的工作。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种可以有效地提取出教学文档中的知识、查准率高的用于网络教学系统的知识自动提取方法及装置。
本发明的目的可以通过以下技术方案来实现:
一种用于网络教学系统的知识自动提取方法,对教师在网络教学系统中上传的教学文档进行关联知识的自动提取,包括以下步骤:
1)建立知识库,该知识库存储有所述网络教学系统相关课程的所有知识点;
2)接收教学文档,对所述教学文档进行预处理,将教学文档转化为提取源文件;
3)知识库中的知识点作为所述教学文档的候选知识点,对每条候选知识点进行分词处理,提取各候选知识点的知识词元;
4)根据所述知识词元计算并调整每条候选知识点在提取源文件中的信用度;
5)计算候选知识点的信用度阈值;
6)判断各候选知识点的信用度是否大于或者等于所述信用度阈值,若是,则将对应的知识点作为所述教学文档的关联知识输出,若否,则舍弃对应的知识点。
所述教学文档包括PPT文件、WORD文件和文本文件。
所述步骤2)中,预处理包括文档格式转换和分词处理,所述文档格式转换是指将PPT文档、WORD文档转化为文本文件。
所述步骤4)中,计算并调整每条候选知识点在提取源文件中的信用度具体为:
401)计算候选知识点中每个知识词元的信用度:
v(WEj|D)=c1×ftj+c2×locj (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410625252.3/2.html,转载请声明来源钻瓜专利网。