[发明专利]词汇译文的获取方法和装置有效
申请号: | 201310745535.7 | 申请日: | 2013-12-30 |
公开(公告)号: | CN103729445B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 王海峰;吴华;刘占一 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词汇 译文 获取 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种词汇译文的获取方法和装置。
背景技术
随着互联网的发展,人们已经不再满足于从单一语言资料中获取信息,开始越来越多的关注从其他语言的资料中获取信息,因此需要借助机器自动翻译系统来实现跨语言信息获取。目前的机器翻译系统能够满足基本的阅读需求,其主要应用于从双语特定分布类型的中文网页中获取互译词对(如英文必须出现在括号中且与中文译文相邻)。例如:“...该调查由非党派的调查机构皮尤基金会(Pew Charitable Trusts)委托经济能动性项目进行...”这段文本中,通过机器翻译系统可以获取“皮尤基金会”的译文“Pew Charitable Trusts”。
但是,对于突发的新闻事件或热点新闻中的词汇,首先是因为现有的翻译词典没有收录,其次是该类词汇很难通过自动翻译方法得到正确的译文,因此译文的准确率比较低。此外该类词汇的翻译通常需要专业翻译工作者根据新闻热点背景来进行专业的翻译,耗费人力,不够方便、智能,用户体验差。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的第一个目的在于提出一种词汇译文的获取方法。该方法可以快速的获取新词对应的译文,不仅方便、智能,并且有效地提高了获取新词对应的译文的准确率,提升了用户体验。
本发明的第二个目的在于提出一种词汇译文的获取装置。
为了实现上述目的,本发明第一方面实施例的词汇译文的获取方法,包括以下步骤:获取待翻译词汇,并根据所述待翻译词汇生成第一搜索结果;根据所述待翻译词汇从所述第一搜索结果中提取与所述待翻译词汇相关的至少一个关联实体词汇,其中,所述待翻译词汇与所述至少一个关联实体词汇属于第一语言;根据所述至少一个关联实体词汇生成所述待翻译词汇的搜索条件,其中,所述搜索条件属于第二语言;根据所述搜索条件进行搜索以获取第二搜索结果;以及从所述第二搜索结果中提取所述待翻译词汇对应的译文。
本发明实施例的词汇译文的获取方法,在根据待翻译词汇生成的第一搜索结果中提取关联实体词汇,并根据关联实体词汇生成的搜索条件获取第二搜索结果,最终在第二搜索结果中提取待翻译词汇对应的译文,可以快速的获取新词对应的译文,不仅方便、智能,并且有效地提高了获取新词对应的译文的准确率,提升了用户体验。此外,借助搜索引擎检索出和新词相关的多语网页具有时效性特点,因此获取的译文也具有很高的时效性。
为了实现上述目的,本发明第二方面实施例的词汇译文的获取装置,包括:待翻译词汇获取模块,用于获取待翻译词汇;第一搜索模块,用于根据所述待翻译词汇生成第一搜索结果;提取模块,用于根据所述待翻译词汇从所述第一搜索结果中提取与所述待翻译词汇相关的至少一个关联实体词汇,其中,所述待翻译词汇与所述至少一个关联实体词汇属于第一语言;搜索条件生成模块,用于根据所述至少一个关联实体词汇生成所述待翻译词汇的搜索条件,其中,所述搜索条件属于第二语言;第二搜索模块,用于根据所述搜索条件进行搜索以获取第二搜索结果;以及译文提取模块,用于从所述第二搜索结果中提取所述待翻译词汇对应的译文。
本发明实施例的词汇译文的获取装置,在根据待翻译词汇生成的第一搜索结果中提取关联实体词汇,并根据关联实体词汇生成的搜索条件获取第二搜索结果,最终在第二搜索结果中提取待翻译词汇对应的译文,可以快速的获取新词对应的译文,不仅方便、智能,并且有效地提高了获取新词对应的译文的准确率,提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的词汇译文的获取方法的流程图;
图2是根据本发明一个实施例的提取与待翻译词汇相关的至少一个关联实体词汇的流程图;
图3是根据本发明一个实施例的根据至少一个关联实体词汇生成待翻译词汇的搜索条件的流程图;
图4是根据本发明另一个实施例的词汇译文的获取方法的流程图;
图5是根据本发明一个实施例的对网页相似度进行检测的流程图;
图6是根据本发明一个实施例的对待翻译词汇和待翻译词汇对应的译文进行译文检 测的流程图;
图7是根据本发明一个实施例的词汇译文的获取装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310745535.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氨氮水质分析仪
- 下一篇:一种肥料快速结块试验装置