[发明专利]一种基于近义词知识图谱的多语言翻译质量评价引擎在审
申请号: | 201810997778.2 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109190129A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 何恩培;李靖 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 近义词 图谱 多语言翻译 分析组件 评估组件 输入组件 语种 质量评价系统 测试 评价系统 质量评价 组件包括 组件分析 引擎 更新 | ||
1.一种基于近义词知识图谱的多语言翻译质量评价系统,所述评价系统包括源语种输入组件、分析组件、评估组件以及知识库组件;所述知识库组件包括可持续训练更新的近义词知识图谱知识库;所述分析组件,基于所述知识库组件分析测试人员针对源语种输入组件输入的待译语料给出的测试结果,将分析结果输入所述评估组件,从而得出测试人员的评价得分;
其特征在于:
所述知识图谱知识库包含近义词或者相关词的相似距离得分;所述评估组件基于所述知识图谱知识库和标准答案进行拟合打分,得出测试人员的翻译质量得分。
2.如权利要求1所述的系统,其中,所述分析组件对所述测试结果进行分词并过滤,得出关键性评价词。
3.如权利要求1或2所述的系统,其中,所述知识库组件基于word2vec的基础上构建近义词和相关词汇的距离度量。
4.如权利要求1所述的系统,所述标准答案为事先预备的对应于所述待译语料的翻译结果。
5.如权利要求4或1所述的系统,所述标准答案为多份,每份来源独立。
6.如权利要求1所述的系统,进一步包括知识库组件更新引擎,基于分析组件和/或评估组件的输出结果,对所述知识图谱知识库进行更新。
7.一种基于近义词知识图谱的多语言翻译质量评价方法,所述方法包括源语种输入步骤、目标语种分析步骤、目标语种评估步骤;
所述源语种输入步骤,输入待译语料,待测人员基于所述待译语料给出测试结果构成目标语种;
所述目标语种分析步骤,对所述测试结果进行分析,给出关键性评价词;
所述目标语种评估步骤,基于所述关键性评价词,对所述待测人员的翻译质量进行评估;
其特征在于:所述目标语种分析步骤,基于可持续训练更新的近义词知识图谱知识库,对所述测试结果进行分词以及过滤处理,基于近义词和相关词汇的距离度量,得出所述关键性评价词。
8.如权利要求7所述的方法,所述目标语种评估步骤,基于所述知识图谱知识库和标准答案进行拟合打分,得出待测人员的翻译质量得分。
9.如权利要求8所述的方法,其中,所述标准答案来自于多种不同翻译引擎;和/或不同人工翻译。
10.如权利要求7-9任一项所述的方法,还包括,反馈更新步骤,当所述待测人员的翻译质量得分满足设定条件时,对所述知识图谱知识库进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810997778.2/1.html,转载请声明来源钻瓜专利网。