[发明专利]翻译效果评估方法、装置、电子设备和存储介质在审
申请号: | 202110718682.X | 申请日: | 2021-06-28 |
公开(公告)号: | CN113822081A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 颜建昊;孟凡东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 效果 评估 方法 装置 电子设备 存储 介质 | ||
1.一种翻译效果评估方法,其特征在于,包括:
对原文进行翻译处理,得到此次翻译处理获取的多个候选译文以及每个所述候选译文对应的准确度评分,其中,所述准确度评分为所述翻译处理确定出的反映对应的所述候选译文的翻译准确度的得分;
根据所述准确度评分以及预设排序规则,对所述多个候选译文进行排序,得到第一排序序列;
根据翻译质量评估指标对每个所述候选译文进行评估,得到每个所述候选译文对应的质量评估分,其中,所述翻译质量评估指标是衡量候选译文与标准译文匹配程度的指标;
根据所述质量评估分以及所述预设排序规则,对所述多个候选译文进行排序,得到第二排序序列;
计算所述第一排序序列与所述第二排序序列之间的误差值,其中,所述误差值反映所述翻译处理的翻译效果;
展示所述误差值,以便用户获取所述翻译处理的翻译效果。
2.如权利要求1所述的方法,其特征在于,所述原文包括l个词组,所述多个候选译文包括k个候选译文,其中,l为不小于2的正整数,k为正整数;
所述对原文进行翻译处理,得到此次翻译处理获取的多个候选译文以及每个所述候选译文对应的准确度评分,包括:
根据所述原文以及k个所述已经生成的前i-1个词组,确定多个备选词组以及每个所述备选词组作为第i个词组的概率值,其中,i为大于1且不大于l的正整数;
从多个所述概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组;
将k个所述第i个词组与各自的前i-1个词组组合,得到k个前i个词组;
重复执行上述步骤,直到得到k个候选译文;
对于k个候选译文中的每个候选译文,根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分。
3.如权利要求2所述的方法,其特征在于,所述根据所述原文以及k个所述已经生成的前i-1个词组,确定多个备选词组以及每个所述备选词组作为第i个词组的概率值,包括:
对于k个已经生成的前i-1个词组中的每个已经生成的前i-1个词组,根据所述原文以及所述已经生成的前i-1个词组,计算词表中a个备选词组的每个词组作为第i个词组的概率值,共得到k*a个概率值,其中,所述词表包括a个备选词组,a为正整数;
所述从多个所述概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组,包括:
从k*a个概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组。
4.如权利要求3所述的方法,其特征在于,所述从k*a个概率值中选择出满足预设要求的k个概率值,包括:
对所述k*a个概率值,按照数值从大到小的顺序进行排序,得到概率值序列;
从所述概率值序列截取前k个概率值。
5.如权利要求3所述的方法,其特征在于,所述从k*a个概率值中选择出满足预设要求的k个概率值,包括:
计算所述k*a个概率值的平均值;
从所述k*a个概率值中随机选择k个大于所述平均值的概率值。
6.如权利要求2所述的方法,其特征在于,所述根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分,包括:
计算组成所述候选译文的多个词组的概率值的乘积,所述乘积为该候选译文对应的准确度评分。
7.如权利要求2所述的方法,其特征在于,所述根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分,包括:
对组成所述候选译文的多个词组中的每个词组的概率值进行对数运算,得到多个对数运算结果;
计算所述多个对数运算结果的加和,所述加和为该候选译文对应的准确度评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110718682.X/1.html,转载请声明来源钻瓜专利网。