[发明专利]一种译员文档精确匹配的方法有效
申请号: | 201310712040.4 | 申请日: | 2013-12-23 |
公开(公告)号: | CN103729421B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 江潮;张芃 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张良 |
地址: | 430070 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种译员文档精确匹配的方法,包括扫描待译文档,确定所述待译文档中的所有词汇和所有语句;根据确定的所述词汇和语句分别进行复杂度计算,得到文档的词汇复杂度和语句复杂度;根据所述文档的所述词汇复杂度和所述文档复杂度计算得到所述文档的翻译难度数值;根据所述待译文档的所述翻译难度数值在数据库中与译员具有的翻译能力等级进行匹配,匹配出与所述待译文档的翻译难度数值对应的译员。本发明通过提供一种文档的翻译难度的计算方法,准确的计算出待译文档的翻译难度,分配给合适的译员,合理的实现资源配置。 | ||
搜索关键词: | 一种 译员 文档 精确 匹配 方法 | ||
【主权项】:
一种译员文档精确匹配的方法,其特征在于,包括:扫描待译文档,确定所述待译文档中的所有词汇和所有语句;根据确定的所述词汇和语句分别进行复杂度计算,得到文档的词汇复杂度和语句复杂度;根据所述文档的所述词汇复杂度和所述语句复杂度计算得到所述文档的翻译难度数值;根据所述待译文档的所述翻译难度数值在数据库中与译员具有的翻译能力等级进行匹配,匹配出与所述待译文档的翻译难度数值对应的译员;其中,根据所述文档的所述词汇复杂度和所述语句复杂度计算得到所述文档的所述翻译难度数值包括:按照翻译难度计算公式计算所述翻译难度数值,所述翻译难度计算公式如下:diff_doc=K1·diff_word+K2·diff_sentence其中,diff_word为所述文档词汇复杂度,diff_sentence为所述文档语句复杂度,K1、K2为多元线性回归系数;其中,所述文档词汇复杂度的计算过程包括:计算出文档的词汇等级、类符形符比和实义词词义密度;按照词汇复杂度计算公式计算,得到所述文档的所述词汇复杂度,所述词汇复杂度计算公式如下:diff_word=K11·grade_word+K12·STTR+K13·density_notional;其中,diff_word为所述文档词汇复杂度,grade_word为所述文档的词汇等级,STTR为所述文档的类符形符比,density_notional为所述文档的实义词词义密度,K11、K12和K13为通过样本计算得到词汇复杂度调节系数;其中,所述文档的词汇等级的计算过程包括:对所述文档进行分词处理,得到所有词汇,并统计得到总词汇数;将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级;分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量;按照词汇等级计算公式计算出所述文档的词汇等级,所述词汇等级计算公式如下:grade_word=K111·word2word+K112·word3word+K113·word4word;]]>其中,wordx为词汇级别为X级的词汇的数量,word为总词汇数,K111、K112和K113为给定样本所计算出的词汇等级调节系数,属于第三级调节系数,该调节系数为多元线性回归系数可以通过最小二乘法计算得到;具体计算方法如下:令:Y=grade_word,对于采集到的n组样本数据:{X11,X12,X13};{X21,X22,X23};{Xn1,Xn2,Xn3};对应给出专家评定出的词汇等级:由此可以获得以下线性方程组:Y1=K111·X11+K112·X12+K113·X13;Y2=K111·X21+K112·X22+K113·X23;Yn=K111·Xn1+K112·Xn2+K113·Xn3;得到:K111K112K113=(X′X)-1X′Y;]]>其中,X'为X的转置矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310712040.4/,转载请声明来源钻瓜专利网。