[发明专利]一种基于问题本体的语义标注和检索方法无效

专利信息
申请号: 201210079110.2 申请日: 2012-03-23
公开(公告)号: CN102629278A 公开(公告)日: 2012-08-08
发明(设计)人: 蔡广军;金芝 申请(专利权)人: 河南科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 洛阳公信知识产权事务所(普通合伙) 41120 代理人: 李宗虎
地址: 471000 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于问题本体的语义标注和检索方法,通过选取问题领域作为本体内容和定义投影的标注方法避免了本体受检索内容影响大、动态变化难以构造使用的不足;通过构造多层次多领域的本体模型避免了轻量级本体模型查准率和查全率低的不足,并且可以通过根据客户要求选择不同的检索标准以避免查准率和查全率不能兼顾的不足;通过面向问题的方法把本体模型划分为多层次多领域的本体模型,避免了本体复杂度高、难以保证语义一致性的不足;通过制定文档的匹配程度,克服了语义检索只支持布尔检索,不能对检索结果排序的不足。
搜索关键词: 一种 基于 问题 本体 语义 标注 检索 方法
【主权项】:
一种基于问题本体的语义标注和检索方法,其特征在于:选取问题领域作为本体内容构建多层次多领域的问题本体模型,采用投影标注方法实现多个本体对单个检索对象的标注,以及基于问题本体的语义检索;具体方法为:(一)构建问题本体模型:(1)、确定问题本体的专业领域和范畴,选择所确定的问题领域作为建模本体的内容,列出问题领域中的概念,并定义构成问题本体模型的三种本体单元,分别为问题本体、导航本体和功能本体;其中,三种本体单元的定义如下:问题本体PO:包含了问题中的各个领域,领域的性质,领域间的关系以及相关的公理和约束;定义:PO={PC,PR,PP,PA}其中,PC是领域概念的集合,包括功能本体和导航本体,PR是PC内元素之间关系的集合,包括导航本体与功能本体之间的关系和导航本体与导航本体之间的关系,PP是PC内元素的属性的集合,PA是表示PC,PR,PP相关元素约束的公理的集合;导航本体NO:可以细分的本体,包含功能本体和代表其它导航本体的领域概念;定义:NO={NC,NR,NP,NA}其中,NC表示领域内的普通概念和细分领域的领域概念的集合,领域概念是某一功能本体或其它导航本体的名字,NR表示NC内元素之间的关系,NP表示NC内元素的属性,NA表示NC,NR,NP相关元素约束的公理的集合;功能本体SO:只包含不能进一步细化的普通概念,不能再细分的本体;定义:SO={SC,SR,SP,SA}其中,SC表示领域SO内的概念的集合,每个概念不再具有子领域,即不与任何领域本体重名,SR表示SC内元素之间的关系,SP表示SC内元素的属性,SA表示SC, SR, SP相关元素约束的公理的集合;(2)、对选定的问题领域进行逐级分解, 并结合步骤(1)中三种本体单元的定义,构建多层次多领域骨架结构的问题本体模型,具体分解步骤如下:首先,根据问题特征分解领域和领域的层次;具体是根据公认的分类方式进行领域层次的分解;其次,根据领域内容的相关性分解;具体是当同一领域存在两个或多个无关内容时,根据领域内不同部分之间的关系分解,当一个领域内不同部分之间无关则分解为不同部分;再次,根据领域的一致性进行分解;具体是当单个领域存在冲突或相矛盾的内容,无法进行语义推理时,或者同一概念、同一关系和同一属性具有不同的语义时,进一步进行分解;最后,根据领域的复杂性进行分解;具体是根据现实的分类和知识的相关性进行分解,以进一步降低领域的复杂度;(二)、利用问题本体模型对检索对象进行语义标注:(1)、确定要检索的范围或内容,从资源库中选取检索对象;(2)、在步骤(一)所构建的问题本体模型基础上,根据各个领域本体的特征和内容确定与领域总匹配度DGolDeg相关的匹配度的权重及投影规则,计算检索对象与问题本体模型中各个领域本体的领域总匹配度DGolDeg,并选择领域总匹配度DGolDeg大于设定的最小匹配度的领域本体,所述领域本体包括导航本体和功能本体;所述的领域总匹配度DGolDeg表示检索对象与领域本体的匹配程度,定义如下:DGolDeg=DComDeg×wi+DNecDeg×wj+DValDeg×wk +DConDeg×wl其中,DComDeg为领域完整度,DNecDeg为领域必要度,DValDeg为领域有效度, DConDeg为领域一致度,wi、wj、wk和wl分别表示领域完整度、领域必要度、领域有效度和领域一致度的权重;领域完整度DComDeg:表示领域模型包含检索对象的程度,用检索对象中可以标注的内容和本体内容的比率衡量,定义如下:  DComDeg=MC/WC×100%领域必要度DNecDeg:表示此领域模型对检索对象的重要程度,用1和可以标注检索对象的领域模型数的比率衡量,定义如下:DNecDeg=1/ON×100%领域有效度DValDeg:表示领域模型对标注检索对象的有效程度,用可以标注的检索对象和领域模型标注的内容和领域模型内容的比率衡量,定义如下:DValDeg=MC/OC×100%领域一致度DConDeg:表示检索对象与领域模型的一致程度,用检索对象中不一致的内容和检索对象的比率衡量,定义如下:DConDeg=(1‑MC)/WC×100%其中,WC表示检索对象的内容,OC表示领域模型的内容,MC表示检索对象中可以用领域模型标注的内容,NMC表示检索对象中不能用领域模型标注的或与领域模型不一致的内容,ON表示可以标注检索对象的领域模型数;(3)、根据步骤(2)中选择的投影规则,使用选定的导航本体或者功能本体对检索对象进行投影标注,实现零到多个本体对单个检索对象的标注;(4)、将标注结果以及对检索对象的引用储存至标注库;(三)、基于问题本体模型的语义检索:(1)、用户输入需要检索的内容作为检索请求,检索问题本体模型,选定问题本体模型中与检索请求相关的导航本体和功能本体作为检索领域本体模型;(2)、确定检索请求在步骤(1)选定的检索领域本体模型中的表示,将表示作为检索目标,并在标注库中查找选定各个领域中标注有检索目标的检索对象,并计算检索目标与查找到的检索对象的总匹配度WGolDeg;用检索对象总匹配度WGolDeg表示检索目标和检索对象的总匹配度,用检索对象标注总匹配度和领域总匹配度的加权和来衡量,定义如下: WGolDeg= WAGolDeg×wp+DGolDeg×wq其中,WAGolDeg为检索对象标注总匹配度,DGolDeg为领域总匹配度,wp表示检索内容标注总匹配度的权重,wq表示领域总匹配度的权重;检索对象标注总匹配度WAGolDeg表示检索对象的标注内容与检索目标总的匹配程度,定义如下:WAGolDeg=WAComDeg×wm+WANecDeg×wn+WAValDeg×wo其中,WAComDeg为检索对象标注完整度,WANecDeg为检索对象标注必要度,WAValDeg为检索对象标注有效度,wm、wn和wo分别表示检索对象标注完整度、检索对象标注必要度和检索对象标注有效度的权重;检索对象标注完整度WAComDeg表示检索对象的标注与检索目标匹配的程度,用检索对象的标注与检索目标匹配的内容和检索目标内容的比率衡量,定义如下:WAComDeg=WAM/Q×100%检索对象标注必要度WANecDeg表示检索对象标注对检索目标的重要程度,用1和可以匹配的检索对象的标注数的比率衡量,定义如下:WANecDeg=1/MWAN×100%检索对象标注有效度WAValDeg表示检索对象的标注内容对检索目标的有效程度,用检索对象标注中与检索目标匹配的内容和检索对象的标注内容的比率衡量,定义如下:WAValDeg= WAM/WA×100%其中,Q表示检索目标的内容,WA表示一个检索对象W的标注内容,WAM表示检索对象标注中与检索目标匹配的内容,MWAN表示可以匹配的检索对象的标注数;(3)、根据用户选取的策略和总匹配度WGolDeg对查找到的检索对象进行排序,删减匹配度较低的检索对象,最后把处理后的检索结果返回给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210079110.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top