[发明专利]翻译系统中语料推荐方法有效

专利信息
申请号: 201510792816.7 申请日: 2015-11-18
公开(公告)号: CN105335357B 公开(公告)日: 2018-07-06
发明(设计)人: 张马成;王兴强;屈耕;熊易 申请(专利权)人: 成都优译信息技术有限公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 谢敏
地址: 610000 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语料 翻译系统 自然语言处理 匹配算法 权重 匹配 语料翻译 返回 匹配度 语料库 实词 搜索 展示
【说明书】:

发明公开了翻译系统中语料推荐方法,包括如下步骤:A)在翻译系统中对用户输入的语料搜索语料库;B)按匹配算法返回语料内容,其中匹配算法采用以自然语言处理方法和评价排名结合的综合推荐机制,自然语言处理方法是找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配的语料,句句权重则是计算输入语料和采用语料之间的采用/展示比的值。本发明通过上述原理,在翻译系统中采用该种语料推荐方法,语料匹配度高,语料翻译更准确。

技术领域

本发明涉及翻译系统领域,具体地,涉及翻译系统中语料推荐方法。

背景技术

翻译软件,将一种语言翻译为另一种语言的软件,分为在线翻译软件和本地翻译软件,无论是我们平时浏览网页还是阅读文献都会或多或少遇到几个难懂的英文词汇,这时我们就不免要翻词典了,且单位、公司、企业对于外文的翻译都有需求,无论是何种语言之间的转换,都关系到其切身利益。

网上的词典工具大概可以分为两种:离线词典,就是可以不用联网,只要下载安装并运行就可以方便取词在线翻译;另外一种是在线翻译词典,它需要我们访问一个网站,而后输入要查找的词汇等。

从上世纪80年代中期开始,基于语料和多引擎机译方法的广泛运用,翻译软件的性能和效率有了明显提高,各式各样的翻译软件如雨后春笋般问世。翻译软件消除了不同文字和语言间的隔阂,堪称高科技造福人类之举,但其译文质量长期以来一直是个问题,离理想目标仍相差甚远,原因在于机器翻译具有一些特殊的困难,制约译文质量的瓶颈所在。

现有的翻译系统中采用的语料推荐方法存在语料匹配度差,最后翻译出的语料准确度差的缺陷。

发明内容

本发明所要解决的技术问题是提供翻译系统中语料推荐方法,在翻译系统中采用该种语料推荐方法,语料匹配度高,语料翻译更准确。

本发明解决上述问题所采用的技术方案是:翻译系统中语料推荐方法,包括如下步骤:

A)在翻译系统中对用户输入的语料搜索语料库;

B)按匹配算法返回语料内容,其中匹配算法采用以自然语言处理方法和评价排名结合的综合推荐机制,自然语言处理方法是找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配的语料,句句权重则是计算输入语料和采用语料之间的采用/展示比的值。

本方案中语料即为需要翻译的词语或句段,语料采用的分值的计算公式为语料采用得分=sum(本语料被某一用户使用次数/某一用户总共使用语料数),语料展示得分=sum(本语料展示给某一用户的次数/该用户总查看语料数),通过公式计算出语料采用得分和语料展示得分,然后将得分相除,就可得到句句权重的值,通过自然语言处理,找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配率较高的语料。而句句权重是以输入语料和采用语料之间的采用/展示比为核心进行计算。即使分词上有一定差异,但越符合输入句段要求的句子,多次使用后也可能达到极高的权重。句句权重的自学习机制则保证了系统的不断自优化。另外,在排序过程中还会参考语料的评价排名情况,采用两种方式相结合的综合推荐机制,最终翻译出来的语料匹配度高,语料翻译更准确。该方法中涉及到的评价排名为动态排名,随时保持常用语料以及语料提供者排前的方式,在进行语料推荐时优先推荐排名靠前的语料,与以往的语料搜索都是简单的整句匹配、分词匹配、规则匹配等方式相比,翻译的准确度更高。

进一步的,步骤B)中评价排名的方法包括如下步骤:

B1)上传需要翻译的语料到翻译系统中;

B2)在翻译系统中的已有语料中查找是否有重复的需要翻译的语料,对于已重复的语料则在该语料总得分上加0.1倍语料重复得分,在语料提供者得分上减0.3倍重复得分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510792816.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top