[发明专利]一种面向数字教育资源的实体对齐方法及系统有效
申请号: | 201910431436.9 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110162591B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 季一木;刘艳兰;刘强;刘尚东;尧海昌;李奎;许正阳 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F40/295 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 数字 教育 资源 实体 对齐 方法 系统 | ||
本发明公开了一种面向数字教育资源的实体对齐方法及系统,首先通过学科主题树对已有教育资源库进行学科分块,并在每个教育资源块内构建分区索引体系;然后SKE算法提取待对齐数字教育资源的知识点标签,通过索引筛选出实体对齐候选集;接着计算候选集中实体对的知识点标签相似性、属性值相似度和文本资源相似度;最后通过将计算得到的实体对相似性数据作为特征值输入构建好的决策树,判定其对齐结果。采用本方法进行数字教育资源的实体对齐,能够大幅度降低实体对齐计算复杂度,提高对齐效率;提升数字教育资源的文本相似度计算精度,从而提高实体对齐准确率。
技术领域
本发明涉及一种数字教育资源实体对齐的方法及系统,属于数字教育资源领域。
背景技术
随着当今技术的发展,基于网络的数字教育资源变得愈加丰富,人们可以通过网络不受地域限制得方便获取大量符合自身需求的优质教育资源,极大得提高了自身的主观能动性。如今,个性化的数字教育资源服务已成为传统教育模式的有力补充,成为一种不可忽视的有效教育渠道。
然而随着数据量的增长,现有的数字化教育资源服务暴露出一些缺点:1)可获取的资源总量过多,导致学生可能需要消耗大量时间进行信息筛选,无法快速获取有效资源;2)网络数字教育资源有着标准不统一、结构不一致,内容分散片面等问题,导致资源分发用户体验不佳。因此,加强数字教育资源整合力度,提高信息资源的融合水平,构建高质量的数字教育资源库,从而进一步提高知用户体验是数字教育资源服务中亟待解决的重要问题之一。
实体对齐是知识融合的关键技术支撑。实体对齐相关问题从数据库诞生之日起就被人们所重视,从20世纪六七十年代提出到现在,实体匹配技术也经历了一系列的发展变化。知识库实体对齐是实体匹配发展到Web3.0后,在不同知识库的链接过程中提出的一种问题,这个问题可以通过将经典的实体匹配技术应用到知识库领域,结合知识库的特点进行实体匹配来解决。
实体对齐算法可以分为成对实体对齐和集体实体对齐。成对实体对齐方法,即将实体对齐问题看作是根据属性相似性评分判断待匹配实体对匹配与否的分类问题,Fellegi和Sunter在1969年就提出了该类实体对齐分类方法的概率模型。后来,Winkler等人在此基础上进行大量研究,构建出一种实体对齐概率模型,在实体对齐中取得较好匹配效果。该模型使用属性值的近似比较代替相等与否的二值比较,将待匹配属性值出现的频率代入到属性值相等概率的计算中,并结合贝叶斯网络对属性的相关性建模,并使用最大估计算法对参数进行估计。随着基于Fellegi-Sunter模型的概率实体对齐方法取得的大量的研究成果,机器学习及统计学习的快速发展,很多机器学习方法也应用到实体对齐领域,并取得了巨大的进展,但仍属于成对实体对齐。集体实体对齐,是在成对实体对齐基础上将实体间关系考虑在内,计算实体对间的结构相似性,综合考虑属性相似性与结构相似性来匹配实体对。Suchanek等人提出了一种新型的基于概率的全局算法,PARIS算法。该算法在不需要任何参数调节的条件下不仅能够有效对齐实体还对齐了实体的类别、属性和关系。常规实体对齐做法需要遍历两个知识库中所有实体对,计算复杂度随着知识库规模二次增长,因此,现有知识库实体对齐研究中存在知识库实体量大,实体对齐复杂度高的挑战。当前提高对齐效率的主要方法是引入数据库中分区技术构建知识库实体的分区索引体系,有效加快实体对齐速度,提高效率。
在语义万维网发展的推动下,针对多源知识库实体对齐国内外开展了很多相关工作,但是大多适用于英文知识库,对于中文知识库的研究较少。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910431436.9/2.html,转载请声明来源钻瓜专利网。