[发明专利]通过变换复杂三元组建立本体的方法和系统有效
申请号: | 201380016700.3 | 申请日: | 2013-03-07 |
公开(公告)号: | CN104205092B | 公开(公告)日: | 2017-03-01 |
发明(设计)人: | F·罗格;T·罗亚恩;M·潘特兰德 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N5/04 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 吴信刚 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 变换 复杂 三元 组建 本体 方法 系统 | ||
技术领域
本发明涉及一种用于知识管理的数据处理方法和系统,更具体地讲,涉及一种用于产生本体(ontology)的技术。
背景技术
本体是由一组概念和概念之间的关系实现的知识的表示,其中知识被包括在基于软件的应用内。当每个应用具有它自己的本体时,应用之间的语义互操作性不是直接的,因为在一个本体的上下文中表示的任何请求在在另一本体的上下文中被处理之前必须被转换。为了在已知系统中提供前述互操作性,映射本体的结构(即,概念和概念之间的关系),并且使用本体映射来转换请求和请求的应答。本体之间的不匹配可能基于使用在其基元的语法、构造或语义方面不同的语言的本体。为了避免本体之间的语言级的不匹配,每个本体可使用相同语言,诸如资源描述框架(RDF)。RDF基于具有主谓宾表达(称为三元组或三联组)的形式的语句。当使用不同方法和技术创建本体时,会出现其它不匹配。在这种情况下,相同概念能够在不同本体中具有不同名称,相同名称能够在不同本体中被用于不同概念,不同概念化方案能够导致不同的表示(例如,类相对于性质、以及类相对于子类)。
发明内容
在第一实施例中,本发明提供一种建立本体的方法。该方法包括下述步骤:
计算机接收从由软件应用提供的自由形式文本提取的多个复杂三元组,每个复杂三元组包括复合主语、复合谓语和复合宾语;
计算机通过基于语法识别所述多个复杂三元组中的核心术语和非核心术语、识别所述多个复杂三元组中的包括名词、动词、形容词和副词的语法元素并且使所述多个复杂三元组标准化,来执行所述多个复杂三元组的语法变换,其中执行语法变换的步骤的结果是其术语与所述语法匹配的多个语法变换后的复杂三元组;
计算机通过将多个简化的三元组中所包括的每个核心术语分派给正好一个术语定义并且分派给参考本体的正好一个识别键来把所述多个语法变换后的复杂三元组分别语义变换为所述多个简化的三元组中所包括的一个或多个简化的三元组,其中每个简化的三元组包括主语术语、谓语术语和宾语术语,并且其中所述一个或多个简化的三元组中的每一个保留各个语法变换后的复杂三元组的语义;
基于参考本体的元模式(meta-schema),计算机通过添加从所述多个简化的三元组中的每个术语具有的与参考本体的对应关系获得的关系并且通过添加所述多个简化的三元组中的术语的定义的语义表示来执行所述多个简化的三元组的充实变换并且将其变换为多个简化和充实的(enriched)三元组,其中所述定义被包括在参考本体中;以及
计算机存储所述多个简化和充实的三元组作为代表提供自由形式文本的软件应用内所包括的知识的新的本体。
在第二实施例中,本发明提供一种用于建立本体的计算机系统。所述计算机系统包括:
中央处理单元(CPU);
存储器,耦接到CPU;
计算机可读的有形存储装置,耦接到CPU,该存储装置包含由CPU经由存储器执行以实现建立本体的方法的指令,所述方法包括下述步骤:
计算机系统接收从由软件应用提供的自由形式文本提取的多个复杂三元组,每个复杂三元组包括复合主语、复合谓语和复合宾语;
计算机系统通过基于语法识别所述多个复杂三元组中的核心术语 和非核心术语、识别所述多个复杂三元组中的包括名词、动词、形容词和副词的语法元素并且使所述多个复杂三元组标准化来执行所述多个复杂三元组的语法变换,其中执行语法变换的步骤的结果是其术语与所述语法匹配的多个语法变换后的复杂三元组;
计算机系统通过将多个简化的三元组中所包括的每个核心术语分派给正好一个术语定义并且分派给参考本体的正好一个识别键来执行所述多个语法变换后的复杂三元组的语义变换并且将其分别变换为所述多个简化的三元组中所包括的一个或多个简化的三元组,其中每个简化的三元组包括主语术语、谓语术语和宾语术语,并且其中所述一个或多个简化的三元组中的每一个保留各个语法变换后的复杂三元组的语义;
基于参考本体的元模式,计算机系统通过添加从所述多个简化的三元组中的每个术语具有的与参考本体的对应关系获得的关系并且通过添加所述多个简化的三元组中的术语的定义的语义表示来执行所述多个简化的三元组的充实变换并且将其变换为多个简化和充实的三元组,其中所述定义被包括在参考本体中;以及
计算机系统存储所述多个简化和充实的三元组作为代表提供自由形式文本的软件应用内所包括的知识的新本体。
在第三实施例中,本发明提供一种计算机程序产品,包括:
计算机可读的有形存储装置;和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380016700.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种去重方法装置与系统
- 下一篇:软件开发活动