[发明专利]一种基于本体匹配的语义查询方法有效
申请号: | 201410004084.6 | 申请日: | 2014-01-04 |
公开(公告)号: | CN103744955B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 黄河燕;史树敏;苏超;冯冲;李侃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 匹配 语义 查询 方法 | ||
技术领域
本发明涉及一种基于本体匹配的语义查询方法,属于计算机应用技术领域。
背景技术
随着网络技术、通讯技术的飞速发展,人们可以接触到的信息呈爆炸式增长,引发了信息过载、检索负荷加重等问题,急需的知识通常被实际不需要的信息垃圾淹没。而世界经济正由工业经济向知识经济转变,知识正在逐渐取代货币资本、劳动力和原材料等有形资源成为经济增长中的关键性生产要素,知识成为具有经济价值的稀缺性资源。人们需要更准确、快速、方便地查询所需的信息、知识,以便更加科学、快速地应用知识指导生活和生产。
语义查询技术是对传统信息查询的改进,它更关注信息的含义,而不停留在其表层文本上,可以克服基于关键词的信息查询的弊端。现有语义查询技术研究大多将本体及相关技术作为语义查询的重要基础,大多实现了领域本体的构建及基本推理,但对本体类、实例、属性之间的关系考虑不足,在某些领域需要充分挖掘类、实例和属性之间的语义关联。本体通过对领域概念和概念之间关系的严格定义来确定概念的精确含义,为信息查询提供语义支持。
发明内容
本发明的目的是为解决如何根据用户关键词从知识库中查询出检索结果的问题,提出一种基于本体匹配的语义查询方法。本方法能够在语义层面进行检索,捕捉设计人员检索意图,提高系统检索效率。
为实现上述目的,本发明所采用的技术方案如下:
步骤一、设置一个阈值λ,本发明中最终返回的本体类、本体个体、本体属性个数都不超过λ;
步骤二、设置一个相似度阈值σ,本发明中最终返回的本体类、本体个体、本体属性与用户输入的字符串的相似度都不低于σ;
步骤三、设定一个相近词对阈值θ,提取含x个词语的句子S1与含y个词语的句子S2的相近词对时,先依次计算句子S1中每个词语与句子S2中每个词语的语义相似度,构成x*y的相似度矩阵s[x*y],再将相似度从大到小并且相似度不小于阈值θ的词对设置为相近词对,每提取一个相近词对,则将相似度矩阵中其所对应的行和列的值都置为0;
步骤三、获取本体类列表{OntClass1,OntClass2,...,OntClassl},其中OntClassi(1≤i≤l)代表一个本体类,l为正整数,表示含有l个本体类;classList是一个链表,其结点是一个这样的二元组:<OntClassi,simi>,其中OntClassi是一个本体类,simi是这个本体类与用户输入的字符串string的相似度,classList的初始大小为0;
步骤四、对每一个OntClassi,1≤i≤l执行以下步骤:
(1)计算关键词与本体类名称的相似度simNamei:
其中,n是string所含词语的个数,n>1
(2)计算第j个词对中wja和wjb两个词语的权重,句子中词语的权重是词语代表句子概念的程度,与词性、句子长度、句子结构有关,在计算时不考虑虚词,首先给出词性权重,设名词权重为γ1,动词权重为γ2,形容词权重为γ3,数词权重为γ4,其它实词权重为γ5,词语权重的计算公式如下:
其中,γi表示词语的词性对应的权重,k表示句子中出现的词性数,ni表示
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410004084.6/2.html,转载请声明来源钻瓜专利网。