[发明专利]具有习惯用语处理功能的电子词典有效

专利信息
申请号: 98119459.1 申请日: 1998-10-07
公开(公告)号: CN1102271C 公开(公告)日: 2003-02-26
发明(设计)人: 杨力平 申请(专利权)人: 国际商业机器公司
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 于静
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 具有 习惯 用语 处理 功能 电子词典
【说明书】:

发明涉及电子词典,进一步说,涉及具有习惯用语处理功能的电子词典。

多年来,人们一直在研究如何利用计算机使一种文字或口语翻译成另一种文字或口语的机器翻译技术。即在语言学的关于语言形式和结构分析的理论基础上,依靠数学方法建立机器词典、机器语法,利用计算机巨大的存储容量和数据处理能力,在没有人工干预的情况下实现从一种语言到另一种语言(或另外多种语言)的自动翻译。为了实现翻译功能,机器翻译系统必须具有词法分析、句法分析、语法分析、词典、习惯用语词典、语义分析以及输出语言的能力。由于机器翻译是一门涉及到语言学、计算机语言学和计算机科学等多门学科的边缘性应用学科,所以目前还没有比较实用的机器翻译系统。在这种情况下,人们将兴趣转向一种实用的实现了字词级翻译的电子词典。电子词典是以电子数据的形式存储和使用的一种新型词典。电子词典具有很大的灵活性,可以按超媒体和超文本方式组织信息,检索手段多种多样,可以提供动态翻译特性,并对检索到的词条产生文字、声音和图像解释。

然而,目前大多数电子词典只能实现字词级的翻译。例如,对于“Hetake part in the activity”这样的英文语句,借助一般的英-汉电字词典,只能获得单个词“take”的中文翻译,而无法获得“take part in”这一习惯用语的中文翻译。

虽然目前已有一些具有习惯用语处理功能的电子词典,但是它们具有以下缺点:

·当用户输入诸如“take part in”之类的习惯用语时,这类电子词典可以给出它们的译文,而当用户在输入的习惯用语中加入了其他一些词,如“take an active part in”时,这类电子词典就无法自动识别出习惯用语“take partin”,因而无法给出正确的译文。

如果用户提供的查询词不是习惯用语的头词,这类电子词典也不能给出正确的译文。例如,对于习惯用语“take part in”,如果用户指出的查询词为“part”,或“in”,则他就不能得到有关“take part in”这一习惯用户的正确译文。

本发明的具有习惯用语处理功能的电子词典克服了以上缺点。

根据本发明的具有习惯用语处理功能的电子词典,包括:用于以电子数据形式存储多个词条的存储装置,每一词条由第一种语言的标题词和第二种语言的译文组成,其中所述标题词包括第一种语言的习惯用语;用于向存储装置登录新的词条的登录装置;以及根据查询词从存储装置中检索相应的词条的检索装置,其中还包括:文本俘获装置,用于俘获包括查询词的一段文本;断句装置,从文本俘获装置所俘获的文本中识别出包含查询词的语句;局部语法分析装置,识别出包含查询词的语句中所有的语法成份;匹配装置,从词条存储装置中找出所有和语法分析结果匹配的词条并输出。

通过以下参照附图的说明可以使本发明的目的、特征和优点更加清楚。

图1为根据本发明的电子词典的方框图;

图2示出了所述电子词典中习惯用语处理装置的工作流程图;

图3示出了词库匹配流程图。

根据本发明的电子词典如图1所示。输入装置100用于输入第一种语言的词串或文本;词条存储装置200用于以电子数据形式存储多个词条;词条登录装置300用于把新的词条登录到词条存储装置200中去,词条检索装置400从词条存储装置200中检索出与查询词匹配的词条;输出装置500输出与查询词匹配的词条。

如图1所示,根据本发明的电子词典的词条检索装置400包括一个习惯用语处理装置600。该习惯用语处理装置600由文本俘获部分601、断句部分602、局部语法分析部分603以及词库匹配部分604组成。

以下参照图2详细描述习惯用语处理装置600各组成部分的工作情况。如图2所示,当习惯用语处理装置600被激活,文本俘获部分601从屏幕显示俘获一段包含查询词的文本,查询词是用户使用光标指示的词。在此之后,断句部分602识别出包含查询词的语句。局部语法分析部分603对语句中所有可能的语法成份进行识别。词库匹配部分604对词库中的词条和语法分析结果进行匹配,每一匹配的词条给出一个语句段的翻译。这些覆盖了查询词的所有匹配词条形成了一个词条集,输出部分根据词条与语句的匹配程度对所述词条集中的词条排队,然后显示在屏幕上。

对于英-汉电子词典,所述局部语法分析部分603所能识别出的语法成份包括:

1.名词短语;

2.动词短语;

3.介词短语;

4.形容词短语;

5.副词短语;

6.单独成份。

名词短语构成如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/98119459.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code