[发明专利]一种基于Ontology的语义检索方法无效
申请号: | 201310378833.7 | 申请日: | 2013-08-27 |
公开(公告)号: | CN103440314A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 沈琦;张猛;汤艳;宋清明 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ontology 语义 检索 方法 | ||
1.一种基于Ontology的语义检索方法,其特征在于将信息检索从传统的关键词检索提高到语义检索,包括以下步骤:
步骤一,借助本体开发工具完成本体库的构建,通过人工方式,分析旅游领域的概念或核心词汇;
步骤二,根据领域概念之间的关系,利用Jena规则语法格式,完成本体规则库的建立;
步骤三,用户输入检索词汇或者语句,分词搜索引擎进行分词处理;
步骤四,根据概念相似度的计算进行语义检索扩展,形成新的概念集合;
步骤五,用新的集合作为原始词,进行检索,并在本体规则的支持下,对本体进行推理,检索出本体库中隐含的信息;
步骤六,检索到的结果按相似度大小进行排序;
步骤七,将检索结果返回给用户。
2.根据权利要求1所述的一种基于Ontology的语义检索方法,其特征在于步骤四进行语义检索扩展的方法还包括以下步骤:
(1)把用户输入的关键词进行分词处理,形成初始化的集合;
(2)扩展出整个本体库中与初始化集合中的词语语义相同或相似的领域概念,形成新的概念集合;
(3)计算本体概念相似度;
概念距离的计算公式为:
Distance(a,b)=N[a,Ancestor(a,b)]+N[b,Ancestor(a,b)]
式中,Distance(a,b)表示在树型结构中概念结点a和概念结点b的距离,Ancestor(a,b)表示在树型结构中概念结点a和概念结点b的最近共同祖先结点,path(a,b)表示结点a和b在领域本体构成的树型结构中的最短路径上所有概念结点所构成的集合,Distance(x,Parent(x))是子结点与父结点之间的距离,weight(x,Parent(x))是该结点和它父结点之间的边上的权值,α是可调节因子;
在已知领域本体树型结构中任意两个概念结点的距离的前提下,任意两个概念的相似度为:
式中,θ为调节参数;
分母越小,相似度越大;当Distance(a,b)=0时,分母取最小值θ,概念相似度取最大值1,概念结点a与概念结点b是相似的;当Distance(a,b)=∞时,概念相似度取最小值0,概念结点a和概念结点b几乎没任何关系;
(4)把相似度大于预定阈值的概念加入到初始化的集合中,重新扩展为新的检索词集合;所述阈值是在多次用户输入、多次通过相似度计算得出的一个值,阈值过大,很难扩展出新的概念;阈值太小,扩展进来的概念和用户输入关键词语义差距太大;本发明实施例的阈值取0.7。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310378833.7/1.html,转载请声明来源钻瓜专利网。