[发明专利]一种平行语料按翻译质量进行分类的方法及系统在审

专利信息
申请号: 201810166481.1 申请日: 2018-02-28
公开(公告)号: CN108537246A 公开(公告)日: 2018-09-14
发明(设计)人: 席斌;张马成;李明;彭成超;王兴强 申请(专利权)人: 成都优译信息技术股份有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06F17/28
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 宋辉
地址: 610000 四川省成都市中国(四川)自*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语料 平行 分类 算法 前向神经网络 翻译结果 映射关系 翻译 改进型
【说明书】:

发明公开了一种平行语料按翻译质量进行分类的方法,包括以下步骤:S1:建立平行语料评分和平行语料等级之间的映射关系;S2:将平行语料按照翻译结果进行评分;S3:依据平行语料评分和平行语料等级之间的映射关系对翻译结果的评分分值使用前向神经网络模型进行分类。本发明还公开了采用这种方法的系统。本发明一种平行语料按翻译质量进行分类的方法及系统,无论是采用BLEU算法、改进型BLEU算法或者METEOR算法,都可以通过前向神经网络进行分类,有效提高了本发明的通用性和适用范围。

技术领域

本发明涉及翻译领域,具体涉及一种平行语料按翻译质量进行分类的方法及系统。

背景技术

随着经济全球化及国际互联网的飞速发展,自然语言的翻译在促进政治、经济、文化交流等方面起到越来越重要的作用。过去在国际交流领域,人们需要对语言文字进行翻译时,需要采用人工翻译,耗时耗力,而随着计算机软硬件技术的高速发展,计算机翻译及计算机辅助翻译得到了越来越广泛的应用。

平行语料,是指由原文文本及其平行对应的译语文本构成的双语或多语语料;为了提高翻译质量,现有的平行语料普遍采用BLEU算法进行评分,然而BLEU算法的结果往往会受到语料语法、句子长短以及同义词等影响,所以评分结果准确性较差。

发明内容

本发明所要解决的技术问题是现有的平行语料普遍采用BLEU算法进行评分,然而BLEU算法的结果往往会受到语料语法、句子长短以及同义词等影响,所以评分结果准确性较差,目的在于提供一种平行语料按翻译质量进行分类的方法及系统,解决上述问题。

本发明通过下述技术方案实现:

一种平行语料按翻译质量进行分类的方法,包括以下步骤:S1:建立平行语料评分和平行语料等级之间的映射关系;S2:将平行语料按照翻译结果进行评分;S3:依据平行语料评分和平行语料等级之间的映射关系对翻译结果的评分分值使用前向神经网络模型进行分类。

现有技术中,为了提高翻译质量,现有的平行语料普遍采用BLEU算法进行评分,然而BLEU算法的结果往往会受到语料语法、句子长短以及同义词等影响,所以评分结果准确性较差。本发明应用时,建立平行语料评分和平行语料等级之间的映射关系,这种映射关系一般为一对多的映射关系,即平行语料等级对应“一”,而平行语料评分对应“多”;将平行语料按照翻译结果进行评分,这种评分可以采用现有的评分算法,比如BLEU算法,或者改进型BLEU算法,也可以采用METEOR算法进行评分;然后依据平行语料评分和平行语料等级之间的映射关系对翻译结果的评分分值使用前向神经网络模型进行分类;由于通过前向神经网络模型进行分类,可以将评分相似的语料分到同一类,从而有效的降低了评分误差;同时,无论是采用BLEU算法、改进型BLEU算法或者METEOR算法,都可以通过前向神经网络进行分类,有效提高了本发明的通用性和适用范围。

进一步的,步骤S2中所述评分采用BLEU算法进行评分。

本发明应用时,BLEU算法是成熟算法,一般来说评分结果相对稳定,所以选择BLEU算法。

进一步的,所述前向神经网络模型采用感知机模型。

本发明应用时,感知机模型是前向神经网络模型的一种基础模型,由于感知机的运行特性,通过引入偏执量,并通过感知机的激活函数进行运算,可以具有更快的收敛速度,减少运算量,非常适合于大量平行语料的分析整理。

一种平行语料按翻译质量进行分类的系统,包括:用于建立平行语料评分和平行语料等级之间的映射单元;用于将平行语料按照翻译结果进行评分的评分单元;用于依据平行语料评分和平行语料等级之间的映射关系对翻译结果的评分分值使用前向神经网络模型进行分类的前向神经网络单元。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术股份有限公司,未经成都优译信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810166481.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top