[发明专利]一种用于信息类专业实验的课程自动搭建方法及系统在审
申请号: | 202111473648.7 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114491204A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 白杨;郭莹;张虎;陈静;王筠;王继彬 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心);齐鲁工业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/901;G06Q50/20 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250014*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 信息 类专业 实验 课程 自动 搭建 方法 系统 | ||
1.一种用于信息类专业实验课程的自动搭建方法,其特征在于,包括步骤如下:
(1)初始化;
A、爬虫网上信息类课程教材书籍信息,构建基于一门课程的知识点关键词词库以及知识图谱;
B、对资源进行封装,通过步骤A得到的知识点关键词词库对资源包推荐标签,进行标签处理;
(2)根据用户需求构建实验课程:
C、根据用户提供的教材书籍信息拉取出该教材所属的课程知识点关键词词库;
D、根据步骤C匹配拉取出的关键词词库构造出实验课程。
2.根据权利要求1所述的一种用于信息类专业实验课程的自动搭建方法,其特征在于,步骤A中,爬虫网上信息类课程教材书籍信息,构建基于一门课程的知识点关键词词库以及知识图谱,包括步骤如下:
a、进行网络爬虫,获取电子信息类相关专业教材信息,形成电子信息专业教材信息数据库,电子信息类相关专业教材信息包括教材书籍的书名、版本、出版社、作者、所属课程以及目录信息和课程知识图谱,按科目进行划分;
b、对同一所属课程下的教材目录进行字符识别,进行数字化的实现,在数字化结构的基础之上,对目录条的长度进行限制,设定阈值,大于该阈值的目录条定义为长条目录,否则,定义为短条目录,由此划分出长条目录和短条目录;
根据自然语言处理方法对长条目录进行词性标注,得到词性数组,通过词性规则对得到的词性数组提取出一批候选节点;
短条目录则利用词性规则提取出另一批候选节点;
c、在百度百科中鉴定步骤b得到的两批候选节点的存在真实性和可靠性,完成对其的过滤,得到基于一门课程的知识点关键词词库;
d、针对一门课程的知识点关键词词库,根据百度百科中目录上下级结构鉴定这些候选节点形成上下级关系,利用目录的同级结构形成并列关系;
由上下级结构和并列结构形成基于一门课程的知识图谱的初级骨架;
e、对步骤d得到的知识图谱的初级骨架中出现的并列关系再进行上下级结构的划分,也就是对并列关系进行强弱区分,对并列关系中两部分节点出现的次数进行统计,对出现的绝对频率即并列关系中两部分节点出现的次数进行排序,同时设定阈值,绝对频率大于该阈值的节点定义为强并列关系,否则,定义为弱并列关系,如此循环往复,排序筛选,将重新定义的节点按照区分出来的结果对初级骨架进行补充,最终得到完整的基于一门课程的知识图谱。
3.根据权利要求2所述的一种用于信息类专业实验课程的自动搭建方法,其特征在于,步骤b中,设定阈值为9。
4.根据权利要求1所述的一种用于信息类专业实验课程的自动搭建方法,其特征在于,根据自然语言处理方法对长条目录进行词性标注,得到词性数组,通过词性规则对得到的词性数组提取出一批候选节点,具体实现过程如下:
对长条目录进行切词和词性标注,得到词性数组,得到的词性数组利用词性规则提取出一批候选节点;
①利用自然语言处理工具FudanNLP对长条目录进行切词并标注词性,按照顿号和词性为连词的并列连接词对长条目录分裂,一个长条目录分裂出一个字符串数组;
②对每一个分裂成的字符串数组N中的每一个子字符串N[i],形成对每一个N[i]这样的子字符串的一个条目,词性的词性数组;
③对词性数组中相邻的元素进行合并,在合并的过程中对字符串数组中不同位置的字符串采用不同的合并顺序,即:对字符串数组N中的第一个子字符串N[0]的词性数组处理时采用由后往前把连续的形容词、名词合并成一个单词,同时,以N[0]的词性数组中最后一个单词的词性为基准词性,利用基准词性提高对字符串数组N中接下来的字符串在合并词性数组时的准确率,对第二个子字符串N[1]及以后的每一个子字符串的词性数组处理时,采用如下方法:若基准词性为名词,则对N[1]及以后的每一个字符串各自的词性数组中都由前向后匹配到最后一个词性为名词的为止,形成一个单词,否则,不返回结果;若基准词性不为名词或者标定符号,则对N[1]及以后的每一个字符串各自的词性数组中,当第一个词性与基准词性匹配,则形成一个单词,否则,不返回结果;
最终形成的单词即候选节点。
5.根据权利要求1所述的一种用于信息类专业实验课程的自动搭建方法,其特征在于,步骤e中,设定阈值为20。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心);齐鲁工业大学,未经山东省计算中心(国家超级计算济南中心);齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111473648.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:水下蓝绿光高速全双工动中通系统及方法
- 下一篇:文字识别方法和电子设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置