[发明专利]由计算机使用的从自然语言文本开发本体的方法有效
申请号: | 200710154061.3 | 申请日: | 2007-09-13 |
公开(公告)号: | CN101149732A | 公开(公告)日: | 2008-03-26 |
发明(设计)人: | P·拉尔韦 | 申请(专利权)人: | 阿尔卡特朗讯公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;于静 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 使用 自然语言 文本 开发 本体 方法 | ||
1.一种由计算机使用的、用于开发自然语言文本(10)的本体(70)的方法,该方法包括以下步骤:
-从所述文本(10)接收文本数据;
-经由对接收的数据的语法分析(S100)从所述文本中提取语法和有意义的词(20);
-对于所述文本的所述有意义的词(20)中的至少一些的每一个:借助于至少一个电子词典(30、35)搜索(S200)该词(20)的定义(40),提取所述定义的语法和有意义的词,并且基于所述定义的语法和有意义的词创建(S300)所述定义的基本词汇图(50);以及
-根据所述文本的语法,合并(S400)已创建的所述基本词汇图(50)的至少两个,以便创建所述文本的至少一个语义图(60)。
2.根据权利要求1的方法,进一步包括:在所述合并步骤(S400)之前,基于已提取的所述文本的语法和有意义的词,提取所述文本的有意义的词之间的关系的步骤,所述合并步骤基于所述文本的有意义的词之间的所述关系。
3.根据权利要求1的方法,其中:
-所述提取第一步骤进一步包括经由对所述文本的语法结构的语法分析(S100)的提取,所述结构包括一个或更多语法组;以及
-所述合并步骤(S400)进一步基于提取的语法组,以便对于所述一个或更多提取的语法组的每一个创建至少一个语义图(60)。
4.根据权利要求1的方法,进一步包括:对于所述文本的每个有意义的词,借助于所述至少一个词典(35)搜索该词的同义词(45)及所述同义词的定义的步骤;以及
-所述合并步骤(S400)进一步根据所述同义词的定义来实现。
5.根据权利要求4的方法,进一步包括在所述合并步骤之前的步骤:
-对于每个有意义的词,根据该有意义的词及其同义词的定义对找到的同义词分类;
并且其中:
所述合并步骤进一步根据所述同义词分类的结果来实现。
6.根据权利要求1的方法,进一步包括步骤(S500):
-消除未链接到已创建的所述至少一个语义图(60)的部件。
7.根据权利要求1的方法,其中,除所述文本数据的接收步骤之外的所述步骤(S100-S400)的每一个在所述文本数据的接收步骤之后“在进行中”被实现。
8.根据权利要求1到7中任一项的方法,其中,所述至少一个语义图(70)被用诸如OWL或RDF的基于XML的语言格式化。
9.根据权利要求1的方法,其中,所述文本数据对应于服务查询(10)的文本。
10.一种搜索Web服务的方法,包括以下步骤:
-接收通过根据权利要求9的方法创建的所述至少一个语义图(60);以及
-根据已接收的所述至少一个语义图搜索Web服务。
11.一种计算机程序产品,适于执行根据权利要求1到10中任一项的方法的步骤。
12.一种电子数据处理系统,包括适于执行根据权利要求1到10中任一项的方法的步骤的代码装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔卡特朗讯公司,未经阿尔卡特朗讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710154061.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线Mesh及其资源管理方法
- 下一篇:硅基液晶显示装置反射镜面的制作方法