[发明专利]一种基于近义词知识图谱的多语言翻译质量评价引擎在审

专利信息
申请号: 201810997778.2 申请日: 2018-08-31
公开(公告)号: CN109190129A 公开(公告)日: 2019-01-11
发明(设计)人: 何恩培;李靖 申请(专利权)人: 传神语联网网络科技股份有限公司
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 暂无信息 代理人: 暂无信息
地址: 430073 湖北省武汉市东湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 知识库 近义词 图谱 多语言翻译 分析组件 评估组件 输入组件 语种 质量评价系统 测试 评价系统 质量评价 组件包括 组件分析 引擎 更新
【说明书】:

发明提出一种基于近义词知识图谱的多语言翻译质量评价系统,所述评价系统包括源语种输入组件、分析组件、评估组件以及知识库组件;所述知识库组件包括可持续训练更新的近义词知识图谱知识库;所述分析组件,基于所述知识库组件分析测试人员针对源语种输入组件输入的待译语料给出的测试结果,将分析结果输入所述评估组件,从而得出测试人员的评价得分。本发明还包括对应的评价方法。

技术领域

本发明涉及翻译质量评价,更具体的,涉及一种基于近义词知识图谱的多语言翻译质量评价方法和系统。

背景技术

当前,评价一个人的书面翻译能力,主要通过各种测试方式对其进行打分评价。例如,采用主观题和客观题相结合的考试评分方法。对于客观题而言,候选者只需要选择出正确的候选项就可以得分,这部分评分工作可以通过机器统计测试完成;对于主观题而言,由于不同的翻译者对同一待译条目给出的翻译各不相同,而通常出题者给出的参考答案有限,如果采用简单的机器统计,则极易产生误判,因为很可能出现不同翻译者给出的各不相同的翻译结果有可能和参考答案均不相同,但是却均是正确答案的情况。

此时,通常引入人工评卷的手段。但是,当试卷的数量巨大,如果每一份试卷均采用人工评卷,则必将显著提升测试工作量,增加测试成本。

而在实际场景中,在译员翻译以及考核译员的时候,都会有一个对译员的翻译质量进行评价的过程,这一过程也都是有相应的翻译指导教师进行,非常的耗费人力,同时又很强的主观性。

发明内容

为解决现有的翻译能力评估以及翻译质量评估存在的问题,本发明提出了基于近义词知识图谱的翻译质量评价引擎,以一套多语言近义词的知识图谱作为基础知识库,在其基础上使用一套评估机,“Evaluation Machine”,简称EM进行评估译员的翻译质量。

在本发明的第一个方面,提出一种基于近义词知识图谱的多语言翻译质量评价系统,所述评价系统包括源语种输入组件、分析组件、评估组件以及知识库组件;所述知识库组件包括可持续训练更新的近义词知识图谱知识库;所述分析组件,基于所述知识库组件分析测试人员针对源语种输入组件输入的待译语料给出的测试结果,将分析结果输入所述评估组件,从而得出测试人员的评价得分;

所述知识图谱知识库包含近义词或者相关词的相似距离得分;所述评估组件基于所述知识图谱知识库和标准答案进行拟合打分,得出测试人员的翻译质量得分。

具体实现时,可事先持续维护一套可自动更新的多语言近义词知识图谱,此知识图谱包含近义词或者相关词的相似距离得分;所述知识库组件基于word2vec的基础上构建了近义词和相关词汇的距离度量。

当译员接到了一段翻译语料,称为源语种语料,翻译成了目标语言,同时标准答案会准备源语料的几份标准答案,这些答案均由老师提前准备独立好,保证了翻译的正确性;即所述标准答案为事先预备的对应于所述待译语料的翻译结果;

优选的,所述标准答案为多份,每份来源独立。

然后,所述分析组件对所述测试结果进行分词并过滤,得出关键性评价词。

具体而言,分析组件会将译员的翻译语料进行分词,然后会进行一遍过滤,过滤得出的词会是关键评价词,比如对于语义有中心作用的词以及某专业领域需要翻译的比较准的词;

优选的,上述系统还包括知识库组件更新引擎,基于分析组件和/或评估组件的输出结果,对所述知识图谱知识库进行更新。基于这一点,得到的是一种可以持续更新的近义词知识图谱知识库,以此作为评价的知识库基础,保证了词汇能紧跟上语言的发展,不至于落后;同时,本知识库在word2vec的基础上构建了近义词和相关词汇的距离度量,保证了词汇间关系的程度度量,克服了原有近义词只有是否关系的障碍,同时提高了本方法的精细化程度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810997778.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top