[发明专利]由计算机使用的从自然语言文本开发本体的方法有效

专利信息
申请号: 200710154061.3 申请日: 2007-09-13
公开(公告)号: CN101149732A 公开(公告)日: 2008-03-26
发明(设计)人: P·拉尔韦 申请(专利权)人: 阿尔卡特朗讯公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 北京市中咨律师事务所 代理人: 杨晓光;于静
地址: 法国*** 国省代码: 法国;FR
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算机 使用 自然语言 文本 开发 本体 方法
【说明书】:

技术领域

发明一般涉及本体。更具体地涉及一种计算机使用的、用于从自然语言的文本开发本体的方法。

背景技术

在本说明书中,以下术语除非特别指出都以所指明的意义被使用:

-“本体”:本体是组织成图的被组织起来的结构化集合,所述图的关系例如可以是语义关系或组合和继承关系(在对象的意义上)。本体的目的是对给定领域中的知识集合进行建模。

-“OWL”是一种Web本体语言,设计用于必须不仅向用户呈现信息而且还处理其内容的应用。OWL是基于RDF(资源描述框架)语法的XML“方言”,是指用于描述元数据和用于该元数据的特定自动处理的图模型。OWL提供用于定义结构化Web本体的方法。由于补充词汇和格式化语义,OWL语言向机器提供比通常例如使用XML更大的解释Web内容的能力。OWL由提供递增的表达性的三种子语言组成:OWL Lite(或OWL)、OWL DL和OWL Full。OWL-S(其中S代表“语义”)是面向“语义”的,其至今仅作为建议存在,并且还未被标准化。

-“Web服务”是指互联网上可经由标准接口访问的应用,它可以独立于所使用的操作系统和编程语言使用例如基于XML的通信协议与应用或其它Web服务动态交互。同样,在其接口级,Web服务包括基于输入数据或“输入参数”提供结果的处理操作。为使用Web服务,其操作中的一个被调用,并被提供以期望的输入数据,以及恢复输出结果。

-“UML”(统一建模语言):是指一种用于借助于对象建模的符号(而非语言),其用于在其开发期间确定和呈现对象系统的部件,以及在适当的情况下生成其文档。UML当前是OMG标准。它通过合并JimRumbaugh、Grady Booch和Ivar Jacobson的工作而产生,并且已通过众多方式发展。

-“语义Web”是指用于发布、咨询以及最重要的对格式化知识的处理进行自动化的万维网的扩展,这意味着,由语义Web处理的文档包含将被自动处理的格式化信息,而不是自然语言的文本。

-“XML”(可扩展标记语言):SGML语言的演进,它特别被HTML文档设计者用于为个人化数据结构而定义自己的标记。

现代电信技术,特别是互联网,使用户能够快速访问多种服务。在该领域中,语义Web正在全面扩展,特别当涉及用于使用语义方法、借助于现有服务开发服务的应用时。在这点上,越来越多Web服务配备了本体或更一般的语义描述。

在本文中,发明人自己已设定了找到以下问题的解决方案的目的:自动产生自然语言文本的语义描述(例如经由语义图,或换句话说本体)。该文本可以例如对应于以自然语言书写的用户查询。具有这样的查询的语义描述例如将有助于对对应于该查询的Web服务的搜索。

目前,不存在所述问题的任何自动解决方案。已知一种手动解决方案,该方案在于使用例如Protégé或MindManager的语义工具或者甚至例如Rational Rose、Softteam Objecteering、IBM-Rational XDE或MicrosoftUML Visio的UML建模工具“手动”建立语义描述。实际上,凭借其特定构造,UML可以覆盖语义描述所需的所有概念单元:继承、聚合或关联关系、属性、版型、基本数据和标记值、约束等。

然而,这样的解决方案并不令人满意,主要因为它是完全手动的。因此,它实现起来冗长并且易于出错。此外,该解决方案是主观的:结果取决于用户。该解决方案的结果是所获得的描述中缺乏一致性。

因此需要一种用于从文本数据自动(即通过计算机)产生对应于该文本的自然语言文本的语义描述的解决方案。

发明内容

为此,本发明提出了一种计算机使用的、用于开发自然语言文本的本体的方法,该方法包括以下步骤:

-从所述文本接收文本数据;

-经由对所接收的数据的语法分析,从所述文本中提取语法和有意义的词;

-对所述有意义的词中的至少一些的每一个:借助于至少一个电子词典搜索该词的定义,提取该定义的语法和有意义的词,并且,基于该定义的语法和有意义的词创建该定义的基本词汇图;以及

-根据所述文本的语法合并所创建的基本词汇图中的至少两个,以便创建所述文本的至少一个语义图。

本发明的方法的优选实施例具有以下特征中的一个或更多:

-本发明的方法进一步包括在所述合并步骤之前,基于已提取的所述文本的语法和有意义的词提取所述文本的有意义的词之间的关系的步骤,其中,所述合并步骤基于所述文本的有意义的词之间的这些关系;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔卡特朗讯公司,未经阿尔卡特朗讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710154061.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top