[发明专利]文档翻译难度评价方法和装置有效
申请号: | 201510557921.2 | 申请日: | 2015-09-02 |
公开(公告)号: | CN105224524B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 孙奇峰;黄瑾;谢婵娟 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 张旭东 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 翻译 难度 评价 方法 装置 | ||
本发明的实施方式提供了一种文档翻译难度评价方法。该方法包括:获取至少两篇已完成翻译的文档的译员行为数据,其中,所述文档在翻译前是经过文档翻译难度评价模型进行难度评价的文档;以所述译员行为数据和所述文档的特征数据作为训练数据,对所述文档翻译难度评价模型进行训练;根据训练后的文档翻译难度评价模型,对待翻译文档的翻译难度进行评价。此外,本发明的实施方式还提供了一种文档翻译难度评价装置。
技术领域
本发明的实施方式涉及计算机领域,更具体地,本发明的实施方式涉及一种文档翻译难度评价方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着计算机技术的不断发展,翻译业务也被越来越多地放到了互联网上。既然有在线的翻译业务,必然需要对放至互联网上进行翻译的文档进行难度评价,以便确定每篇文档合理的翻译报酬。
目前,主要是通过统计文档中的特征得分和特征权重,利用特定公式计算翻译难度值,从而评价文档的翻译难度。
然而,随着辅助翻译工具的不断进步、语料的不断积累、检索技术的优化,同一篇文档的翻译难度会有所改变,但是,现有的文档难度的评价方法难以体现这种变化,因此导致给出的翻译难度值很难准确反映文档当前的翻译难度。
发明内容
出于翻译难度是一个动态的过程,当前相比较而言比较难的文档可能过一段时间变得不再那么难,在现有技术中,对文档难度的评价是依据待翻译文档中的特征得分和特征权重的,这些量都是固定的,因此,所评价出的翻译难度也必然是固定不变的,因此难以体现难度的变化过程,这是非常令人烦恼的过程。
为此,非常需要一种改进的文档翻译难度评价方法,以使得文档翻译难度的评价结果可以体现这种难度的变化,从而使得难度评价结果更为合理。
在本上下文中,本发明的实施方式期望提供一种文档翻译难度评价方法和装置。
在本发明实施方式的第一个方面中,提供了一种文档翻译难度评价方法,例如,可以包括:获取至少两篇已完成翻译的文档的译员行为数据,其中,所述文档在翻译前是经过文档翻译难度评价模型进行难度评价的文档;以所述译员行为数据和所述文档的特征数据作为训练数据,对所述文档翻译难度评价模型进行训练;根据训练后的文档翻译难度评价模型,对待翻译文档的翻译难度进行评价。
在本发明实施例方式的第二个方面中,提供了一种文档翻译难度评价装置,例如,可以包括:行为数据获取模块,用于获取至少两篇已完成翻译的文档的译员行为数据,其中,所述文档在翻译前是经过文档翻译难度评价模型进行难度评价的文档;训练模块,用于以所述译员行为数据和所述文档的特征数据作为训练数据,对所述文档翻译难度评价模型进行训练;评价模块,用于根据训练后的文档翻译难度评价模型,对待翻译文档的翻译难度进行评价。
通过本发明实施方式的文档翻译难度评价方法和装置,将译员行为数据作为进行文档翻译难度评价模型的训练数据,因为译员行为直接体现了文档对于译员的翻译难度,使得训练后的模型对文档翻译难度进行评价的结果更为合理。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的应用场景;
图2示意性地示出了根据本发明实施方式的文档翻译难度评价装置的设备结构示意图;
图3示意性地示出了根据本发明实施方式的训练模块的设备结构示意图;
图4示意性地示出了根据本发明实施方式的训练单元的设备结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510557921.2/2.html,转载请声明来源钻瓜专利网。