[发明专利]一种面向中文语言的大规模本体映射方法有效
申请号: | 201510082840.1 | 申请日: | 2015-02-15 |
公开(公告)号: | CN104699767B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 王汀;刘经纬;蔡万江 | 申请(专利权)人: | 首都经济贸易大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 刘萍 |
地址: | 100070 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 中文 语言 大规模 本体 映射 方法 | ||
技术领域
本发明涉及中文本体映射领域。
背景技术
语义Web的愿景是建立―数据之网‖(Web of Data),以使机器能够理解网络上的语义信息。本体作为语义Web的核心元素,是描述特定领域共享概念的形式化、规范化说明,是实现网络知识共享和语义互操作的基础。目前由于不同本体之间存在异构性,导致了本体间的重用和共享变得困难。
本体映射(Ontology Alignment)的任务就是要发现异构本体之间的概念语义关联。但是由于文化和背景原因,目前尚缺乏成熟的面向中文语言描述的本体映射系统。而随着语义网的发展,大规模的中文语言描述的本体和知识库也越来越多地被构建和共享。同时,中文本体映射系统的构建尚处于起步阶段。因此,本发明主要解决面向中文描述的大规模本体映射系统的构建问题。
国内外研究人员已提出了多种映射方法和典型系统。文献[Cohen W,Ravikumar P,Fienberg S.A comparison of string distance metrics for name-matching tasks[C].Proceedings of the IJCAI Workshop on Information Integration on the Web(IIWeb).Acapulco,Mexico,2003:73-78]中列出了基于编辑距离和基于Token的几种典型元素级相似度计算算法,并对几种算法的性能进行了评测。Melnik S等[Melnik S,Garcia-Molina H,Rahm E.Similarity flooding:A versatile graph matching algorithm and its application to schema Matching[C].Proceedings of the 18th International Conference of Data Engineering(ICDE).San Jose,California,2002:117-128]提出了一种结构级本体映射算法:Similarity flooding,该系统利用本体的概念体系构造相似度传播图,并对概念之间的相似度进行传播和修正。Zhong Qian等[Zhong Q,Li H,Li J,Xie G,Tang J,Zhou L,Pan Y.A gauss function based approach for unbalanced ontology matching[C].Proceedings of the 28th International Conference on Management of Data(SIGMOD).Rhode Island,USA,2009:669-680]开发了RiMOM系统,该系统基于本体实例、概念名称以及本体结构等特征的多策略映射方式,并通过引入普适的场论思想,使其适用于大规模本体的映射任务。但其缺乏针对中文特定语言特点的优化。Giunchiglia F等[Giunchiglia F.,Yat skevich M..Element level semantic matching[D].Italy:Dept.of Information and Communication Technology University of Trento,2004]提出基于语言学方法,并引入共享知识词典(如:WordNet),利用语言关系进行语义关系发现。文献[Isaac A,Meij L,Schlobach S,Wang S.An empirical study of instance-based ontology matching[C].Proceedings of the 6th International Semantic Web Conference and the 2nd Asian Semantic Web Conference(ISWC/ASWC).Busan,Korea,2007:253-266]提出一种实例级的本体映射算法,它根据本体概念的公共实例数量来度量概念之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都经济贸易大学,未经首都经济贸易大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510082840.1/2.html,转载请声明来源钻瓜专利网。