[发明专利]一种面向学科教育资源的知识图谱构建方法在审
申请号: | 201810451382.8 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108664615A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 刘海;杨宗凯;刘三女牙;张昭理;舒江波;李志飞;刘婷婷 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
地址: | 430079 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向学科教育资源的知识图谱构建方法,该方法包括了以下步骤:(1)提取学科教育资源中的实体、关系信息;(2)对信息进行清理整合,剔除信息冗余和错误信息,从而确保信息的质量;(3)将信息进行分类和语义关联,形成“实体‑关系‑实体”三元组的知识表现形式,利用可视化工具构建学科资源知识图谱;(4)通过知识推理进一步挖掘隐含的知识,对知识图谱进行进化更新,从而丰富、扩展知识库。本方法提出构建学科资源的知识图谱,实现学科资源内容的连续性和一致性,为学习者提供系统化和体系化的学科知识图谱,促进知识图谱技术在教育资源管理、信息检索、知识推荐等领域的实际应用。 | ||
搜索关键词: | 图谱 学科教育 图谱构建 构建 学科 知识库 错误信息 关系信息 教育资源 信息检索 信息冗余 学科知识 语义关联 知识表现 资源内容 可视化 三元组 体系化 系统化 推理 整合 隐含 剔除 进化 分类 挖掘 更新 应用 管理 | ||
【主权项】:
1.一种面向学科教育资源的知识图谱构建方法,其特征在于,包括以下步骤:1)学科资源信息抽取:从经过数字化处理、能在多媒体计算机及网络环境下运行的多媒体教学材料中抽取学科领域词汇和关系,具体如下:1.1)基于语言学规则的方法对学科资源中的文本信息进行分词和词性标注;1.2)使用TF‑IDF统计学基准比较分析词汇分布特征,计算词汇在资源中的相对重要程度;1.3)对学科资源中的文本信息中的学科领域词汇进行抽取;2)词汇和关系信息的清理整合:对步骤1)中抽取的信息在同一框架规范下进行数据处理操作,形成高质量的知识库;具体步骤如下:2.1)输入抽取的词汇和关系的详细信息,包括数据名称、地址和对应的资源,并且给每个预设定的质量维度分配一个权重;2.2)利用专家系统得到实体信息的重要程度,并结合质量维度的权重计算实体信息相应的分值;2.3)统计所有实体信息对应的权重和分值,得到实体数据的得分,然后过滤得分后50%的实体信息;3)根据知识库构建学科资源图谱,构建的具体步骤如下:3.1)在步骤2)高质量知识库的基础上,对这些知识进行语义关联,形成“实体‑关系‑实体”三元组的知识表现形式;3.2)将知识库中的每个三元组(h,r,t)的头实体和尾实体向关系空间中投影,让其满足头实体h加对应关系r等于尾实体t(h+r≈t)的条件,据此思路构建一个实体表征模型的损失函数:其中,d(h+r,t)是一个距离函数用于度量h+r与t之间的距离,S为知识库中的三元组,S’是负采样的三元组,[x]+表示正值函数;通过使损失函数值趋近于最小值优化上述目标函数即可得到关于知识的特征表达;4)知识图谱进化更新,具体步骤如下:4.1)对知识图谱本体中的元素进行更新,包括概念的增加、修改和删除,以及概念属性的更新;4.2)通过新增实体数据对知识图谱进行更新,包括添加和删除实体,修改实体的基本信息和属性值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810451382.8/,转载请声明来源钻瓜专利网。