[发明专利]一种基于知识图谱构建计算机教育知识图谱的方法在审
申请号: | 202210555029.0 | 申请日: | 2022-05-20 |
公开(公告)号: | CN114896417A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 朱颢东;李红婵;路延通;韩朝阳;李展鹏;王建文;朱状;马钰;马紫帅 | 申请(专利权)人: | 郑州轻工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/26;G06F16/24 |
代理公司: | 郑州晟佳专利代理事务所(普通合伙) 41205 | 代理人: | 张心龙 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 构建 计算机教育 方法 | ||
本发明公开了一种基于知识图谱构建计算机教育知识图谱的方法,包括以下步骤:步骤一:构建教育知识图谱,S1:进行数据获取,S2:进行知识抽取,S3:进行知识标识,S4:进行知识存储,S5:进行知识融合,S6:进行质量控制,步骤二:教育知识图谱的平台建设,A:搭建网页,所述搭建网页包括教育知识图谱展示模块、智能问答模块和知识点查询模块。本发明基于互联网获取到的教育大数据构建面向教育大数据的知识图谱,以可视化的形式对网络安全知识进行直观展示,并对其中所存在的不完整知识利用知识图谱补全技术进行补全,解决了教学分析面临的信息采集不全和信息采集难度高的难度。
技术领域
本发明涉及知识图谱技术领域,特别涉及一种基于知识图谱构建计算机教育知识图谱的方法。
背景技术
将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论称为知识图谱。
大数据时代为当代教育模式的创新发展提供了新的发展环境,教学过程中产生的大量异构数据能为教学质量的精准分析与评估提供依据,目前教学分析由于没有完整的教育知识图谱,故面临着信息采集不全和信息采集难度高的难题。
发明内容
本发明的目的在于提供一种基于知识图谱构建计算机教育知识图谱的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于知识图谱构建计算机教育知识图谱的方法,包括以下步骤:
步骤一:构建教育知识图谱;
S1:进行数据获取,运用爬虫技术获取网络上的数据;
S2:进行知识抽取,从结构化、半结构化和非结构化的资源中进行实体提取、关系提取和属性提取;
S3:进行知识标识,采用三元组进行标识;
S4:进行知识存储,将爬取到的知识存储到Neo4j图数据库中;
S5:进行知识融合,对初步构建成的知识图谱中缺失实体的三元组进行补全,然后添加到知识图谱当中;
S6:进行质量控制,采用知识消歧、知识补全和知识更新进行教育知识图谱质量控制;
步骤二:教育知识图谱的平台建设:
搭建网页,所述搭建网页包括教育知识图谱展示模块、智能问答模块和知识点查询模块。
优选的,所述S1中数据来自于书籍、文献和技术网站,所述S1中爬虫技术是通过浏览器向服务器发送请求,获取到需要的数据,所述S1中使用Scrapy框架来实现数据爬取,Scrapy框架包含request、下载器、解析器和twisted。
优选的,所述S2中实体抽取是从文本中识别人名、地名和机构名并对其分类,所述S2中关系抽取是从一个文本数据中抽取两个实体的关系,所述S2中属性抽取是对时间和常量进行抽取。
优选的,所述S3中三元组表示为:
数据结构、包括、数组。
优选的,所述S4中采用Py2neo工具包来对数据进行存取操作,Py2neo应用程序与命令行能够与Neo4j建立连接。
优选的,所述S5中补全方式是检测出当前知识图谱中缺失的三元组对于头和尾实体进行补全,需给定三元组的头和尾的实体以及关系,然后组成正确三元组的实体。
优选的,所述步骤二中搭建网页采用B/S架构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210555029.0/2.html,转载请声明来源钻瓜专利网。