[发明专利]一种译员文档精确匹配的方法有效
申请号: | 201310712040.4 | 申请日: | 2013-12-23 |
公开(公告)号: | CN103729421B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 江潮;张芃 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张良 |
地址: | 430070 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 译员 文档 精确 匹配 方法 | ||
技术领域
本发明涉及翻译技术领域,具体而言,涉及一种译员文档精确匹配的方法。
背景技术
在翻译流程中,为待译文档选择合适的译员是其中最重要的一个环节。为保证译文的翻译质量,首先要求译员的翻译能力足以胜任的待译文档的翻译难度,其次从性价比的角度考虑,也要求译员的翻译能力不要过于超出待译文档的翻译难度,以使得翻译质量和翻译代价之比最优。译员的翻译能力是一个动态的能力值,对于翻译企业来说,译员的翻译能力值是通过译员在不断的翻译生产过程中所得到的一个加权评分值,相对来说是个固定的可获取的能力值,但待译文档的翻译难度的判定则需要根据每篇文档的具体情况而定。对于文档翻译难度的判别可以分为人工判别和机器判别。人工判别是通过语言专家或翻译专家对待翻译文档进行标注和判断,由于人的阅读和理解限制,这种方法速度较慢同时要耗费非常大的的人力成本,并且由于判别人能力的参差以及每人对文档难度的理解不同而产生很大的判别差别,判别结果无法做到统一标准,客观性很差。机器判别是通过计算机结合一定的方法对文档进行翻译难度判断,目前最常用的方法是通过对文档中生僻字词的统计来进行难度判断,这种单一维度的判断方法其用来作为判别因素的可靠性比较单薄,有较大的片面性,得到的判别结果往往与实际情况差别很大,无法保证判别结果的准确性。目前对文档翻译难度的判别,还缺乏一个既高效又相对准确的判别方法,从而保证译员文档能够进行快速准确的匹配。
发明内容
本发明旨在提供一种译员文档精确匹配的方法,解决了如何将文档分配给合适的译员的问题。
本发明公开了一种译员文档精确匹配的方法,包括:
扫描待译文档,确定所述待译文档中的所有词汇和所有语句;
根据确定的所述词汇和语句分别进行复杂度计算,得到文档的词汇复杂度和语句复杂度;
根据所述文档的所述词汇复杂度和所述文档复杂度计算得到所述文档的翻译难度数值;
根据所述待译文档的所述翻译难度数值在数据库中与译员具有的翻译能力等级进行匹配,匹配出与所述待译文档的翻译难度数值对应的译员。
优选地,计算所述文档的词汇复杂度的过程包括:
计算出文档的词汇等级、类符形符比和实义词词义密度;
按照词汇复杂度计算公式计算,得到所述文档的所述词汇复杂度,所述词汇复杂度计算公式如下:
diff_word=K11·grade_word+K12·STTR+K13·density_notional;
其中,diff_word为所述文档词汇复杂度,grade_word为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11、K12和K13为通过样本计算得到词汇复杂度调节系数。
优选地,在计算所述文档的词汇等级之前,还包括:
对所述文档进行分词处理,得到所有词汇,并统计得到总词汇数;
将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级;
分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量;
计算所述文档的词汇等级的过程包括:
按照词汇等级计算公式计算出所述文档的词汇等级,所述词汇等级计算公式如下:
其中,wordx为词汇级别为X级的词汇的数量,K111、K112和K113为通过样本计算得到词汇等级调节系数,word为总词汇数。
优选地,在计算所述文档的类符形符比的过程包括;
根据得到的所有所述词汇,统计其中的类符数和形符数,计算所述类符数与所述形符数之比,得到所述文档的类符形符比;或
将得到的所有所述词汇按照标准数量划分为多个子文档,及1个不足标准数量词汇的子文档,按照类符形符比计算公式计算,得到所述文档的类符形符比;所述类符形符比计算公式如下:
其中,token为所述不足标准数量词汇的子文档的形符数,type为不足标准数量词汇的子文档的类符数,typei为第i个含标准数量个词汇的子文档的类符数,n为所述含标准数量个词汇的子文档数量,ST为所述标准数量个词汇划分单位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310712040.4/2.html,转载请声明来源钻瓜专利网。