[发明专利]一种编程教育知识图谱构建、补全与智能问答的方法在审
申请号: | 202111491707.3 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114238653A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 冯博;王丽苹;宋培东;李逸飞;周琪丰 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/242;G06F40/295;G06N3/04;G06Q50/20 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编程 教育 知识 图谱 构建 智能 问答 方法 | ||
本发明公开了一种编程教育知识图谱构建、补全与智能问答的方法,其方法包括以下步骤:a)处理编程领域知识,通过BiLSTM‑CRF结合人工构建的知识点术语词典构建半自动化识别实体工具,借助该工具辅助人工构建编程领域知识图谱;b)通过基于节点中心性判别的知识图谱质量评估算法发现知识图谱需要补全之处,并使用直接完善或众包方式对知识图谱进行补全;c)基于编程领域知识图谱搭建编程教育领域智能问答系统。本发明相比传统的相关方法,依托构建的编程教育领域知识图谱,完成了编程教育领域智能问答系统。解决了知识图谱从构建到补全,并依托此应用于问答系统这一实际问题。
技术领域
本发明属于计算机科学领域,具体涉及一种编程教育知识图谱构建、补全与智能问答的方法。
背景技术
知识图谱以智能、高效的组织知识方法,使相关应用可以准确迅速查询到需要的信息,为知识管理提供了新思路,综合知识图谱上下位关系、属性等信息,可以为数据挖掘、问答系统提供支持,知识图谱已经成为促进人工智能发展的核心驱动力之一。近年来,随着知识图谱技术的发展,知识图谱应用与研究的重心逐渐从开放域知识图谱转向了领域知识图谱,知识图谱与各行业的深度融合成为趋势。领域知识图谱由于其聚焦于某一特定领域知识的特点,具有更强的针对性和专业性,往往更具应用价值。
在Freebase数据集中,有75%的人没有国籍信息,71%的人没有出生地信息,实体类型信息的缺失会严重影响应用过程的准确率和召回率。知识图谱补全是知识图谱构建中的热门问题之一,在人工构建知识图谱过程中,难免遇到知识不够完善、有很多缺失地方、实体之间的隐性关系未被完全挖掘等问题,因而需要方法手段对知识图谱中的不完整性和稀疏性等问题进行解决。
智能问答是当今十分热门的自然语言处理领域中非常重要的研究方向,已获得了各行各业的广泛关注,并且已经在互联网、医疗、金融等领域进行了相关应用尝试。
通过调研发现,当前并没有一个聚焦于计算机科学垂直领域的中文知识图谱,而其他涉及计算机相关的开放域中文知识图谱又存在数据质量不高、内容单薄的问题,在其上也没有合适的中文问答系统供人使用。构建一个计算机科学垂直领域的知识图谱,并提供知识图谱评估算法和对知识图谱进行长期、稳定更新的解决方案,具有先河性和创造性。
调研发现,当前基于文本的问答系统,知识常以纯文本或超文本标记语言的形式存储,例如百科文本等,对通过知识图谱解决该问题的研究仍具有一定现实意义和发展空间。
发明内容
本发明的目的是提供一种编程教育知识图谱构建、补全与智能问答的方法,构建了计算机科学领域知识图谱,并提供了知识图谱质量评估算法和长期稳定更新知识图谱的解决方案;依托动态更新的知识图谱,构建问答系统,可以更结构化、关联化组织海量知识资源,回答问题更加高效。
实现本发明目的的具体技术方案是:
一种编程教育知识图谱构建、补全与智能问答的方法,该方法包括以下具体步骤:步骤1:构建一个包含程序设计基础、数据结构、算法课程知识的编程垂直领域知识
图谱,具体包括:
A1:借助书籍、网站结构化知识源,从中提取本体模式和知识点,用自顶向下的构建方式得到本体约束,构建本体约束五步法:确定本体的专业领域和范畴、列出本体中的重要术语、定义类和类的层次关系、定义类的属性、定义类之间的关系;
A2:将编程领域书籍、网站的知识文本语料中每句知识点作为一条语料数据,人工标注每条语料数据包含的实体,这些语料数据构成语料数据集,采用标注方法BIO对数据进行标注,即注明句子中每个字是知识点术语实体的开头、知识点术语的中间或其他非知识点术语词汇,将语料中整理出的知识点术语实体整合得到知识点术语词典;
A3:使用模型BiLSTM-CRF结合步骤A2构建的知识点术语词典进行实体匹配识别,即双向LSTM网络作为特征提取器,序列化标注算法CRF进行命名实体识别输出;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111491707.3/2.html,转载请声明来源钻瓜专利网。