[发明专利]自然语言的形式化在审

专利信息
申请号: 200880115885.2 申请日: 2008-11-12
公开(公告)号: CN101855630A 公开(公告)日: 2010-10-06
发明(设计)人: I·波波夫;K·N·波波夫 申请(专利权)人: I·波波夫;K·N·波波夫
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 北京戈程知识产权代理有限公司 11314 代理人: 程伟;孙向民
地址: 保加利*** 国省代码: 保加利亚;BG
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自然语言 形式化
【说明书】:

技术领域

本发明涉及在使用自然语言的机器中输入知识。其可以用作自然语言的机器翻译器。

背景技术

最常用的机制是用机器解释自然语言定义的词语集合-所有的人工语言都是该类型。已经有定义词语的语法含意的尝试。开发了对于给定的文本给出主题领域,以此方式还可以定义词语的优选含意,因此例如可以在机器翻译中实现更好的结果。还尝试了根据文本中其他词语以及该词语在其他词语中的使用统计来定义一个词语的含意。也尝试了对给定自然语言和其他自然语言中的词语设定来自同一集合的数值,因此来自两种语言的具有同一适当值的词语具有相似的含意。

发明内容

技术问题

通过机器来明确的解释自然语言的问题还没有解决,这对于向使用自然语言的机器输入知识和数据来说是个障碍。机器不能用于文件的正式翻译,因为这不是翻译的可靠方式。其不能生成对于不同的人具有明确的解释的自然语言文本,但是这在书写教科书或专利申请时又非常重要。计算机不能被编程来使用自然语言,因为自然语言的一个句子从形式上来看具有很多可能的含意,因此语法上正确的句子可以以不同方式解释。现有的人类知识不能最优地使用,因为没有形式化的方式来使得机器直接解释用自然语言书写的知识。

技术方案

解释自然语言一般包括构建已解释的知识的机器模型。通过不同的方式解释自然语言文本,因此可以定义言语的语法部分、句子以及句子中词语的含意。问题在于没有回溯关系,并且人不能对形成的模型施加影响。这是因为,在该模型和自然语言文本之间没有比较的基础。因此该模型还是一种不能只被一种方式来解释的结构。技术的核心是提供一种用于生成明确模型的方法。以此方式形成的模型只能用唯一的方式来解释。

该方法包括五个步骤。

在第一步骤中,对大量的语言进行研究,其目的是定义人类所使用的概念的基础。还要考虑自然语言中的词语是否是基本概念。基本概念表示一些实体或动作。通常自然语言中的同一个词语表示几个不同的基本概念,因此词语具有不同的含意。技术层面上表示“cлъHцe=1”(“cлъHцe”在英语中意思是太阳)和“sun=1”可以有助于进行机器翻译,但是其不能有助于进行有含意的明确的翻译。在此类系统中,翻译的结果可能是这样的:“User rights=пpaBaTa Ha HapкoMaHa”(“пpaBaTa Ha HapкoMaHa”在英语中意思是药瘾者的权利),但是实际上在给定的上下文中“user rights”意思是消费者的权利。列举的这类词语产生了具有不明确含意的中间语言。这里列举的是实体而不是词语。根据本方法的实体具有唯一的名称。名称可以是数字,但是也可以是来自广泛传播的自然语言的词语。还应注意,自然语言中的给定的词语只能用一种方式来表示一个实体。在此方式下,“cлъHцe”(“cлъHцe”在英语中意思是太阳)只能有一个含意-星星,对于词语“cлъHцe”的所有其他含意,必须选择其他词语。应理解,这类对含意进行命名对自然语言没有影响。对于根据该方法的实体,用它们的描述来进行特征化。以相同的方式用自然语言来给出实体的描述,这通过自然语言的词典来完成。每个实体具有一个词语列表,通过词语列表能够以自然语言来命名实体-有些像词典,但它是针对实体而不是词语。

关于实体的结构,该实体具有唯一标签-名称或数字、描述和以自然语言表示所述实体的词语列表,该结构进一步被称为基本概念。

所述方法的第二步骤是只利用基本概念来生成自然语言文本。在本方法的该步骤中,其利用了背景技术中的所有可适用的方法,这能够定义文本中的词语的语法和语义含意并能够生成模型。在生成模型期间,可以利用词语的不同含意的全局使用统计或者针对该方法每个使用者的局部统计。可以使用已经明确词语含意的相似文本。将给定的文本从一种语言翻译到另一种语言的人工翻译也可以用于定义自然语言文本中使用的基本概念,因为翻译中使用的词语被研究,并且鉴于它们的含意而与来自原始文本中的词语相比较。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于I·波波夫;K·N·波波夫,未经I·波波夫;K·N·波波夫许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200880115885.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top