[发明专利]翻译系统中语料推荐方法有效
申请号: | 201510792816.7 | 申请日: | 2015-11-18 |
公开(公告)号: | CN105335357B | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 张马成;王兴强;屈耕;熊易 | 申请(专利权)人: | 成都优译信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 谢敏 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 翻译系统 自然语言处理 匹配算法 权重 匹配 语料翻译 返回 匹配度 语料库 实词 搜索 展示 | ||
1.翻译系统中语料推荐方法,其特征在于,包括如下步骤:
在翻译系统中对用户输入的语料搜索语料库;
按匹配算法返回语料内容,其中匹配算法采用以自然语言处理方法和评价排名结合的综合推荐机制,自然语言处理方法是找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配的语料,句句权重则是计算输入语料和采用语料之间的采用/展示比的值,评价排名的方法包括如下步骤:
B1)上传需要翻译的语料到翻译系统中;
B2)在翻译系统中的已有语料中查找是否有重复的需要翻译的语料,对于已重复的语料则在该语料总得分上加0.1倍语料重复得分,在语料提供者得分上减0.3倍重复得分;
B3)在使用语料的过程中,采用pagerank思想,针对提供者和语料本身计算各自得分,每当有语料被展示一次,在该语料总得分上减0.1倍语料展示得分,该语料被采用一次,则在语料总得分上加上0.8倍语料采用得分且在语料提供者得分上加0.7倍采用得分,语料提供者得分=采用得分*0.7-重复得分*0.3+上传得分*0.2+语料提供者初始值,其中的采用得分=sum(该语料提供者的某一语料被使用的次数/该语料被展示次数),其中的重复得分=sum(重复语料的上传人数个数/被上传次数),其中的上传得分=log(上传语料数);
B4)基于步骤B3)算出语料总得分和语料提供者得分,根据得分得出语料和语料提供者的等级。
2.根据权利要求1所述的翻译系统中语料推荐方法,其特征在于,步骤B3)中语料总得分的计算公式为:语料总得分=语料重复得分*0.1+语料采用得分*0.8-语料展示得分*0.1+语料初始值,其中的语料重复得分=上传人数个数/语料被上传次数,其中的语料采用得分=sum(本语料被某一用户使用次数/某一用户总共使用语料数),其中的语料展示得分=sum(本语料展示给某一用户的次数/该用户总查看语料数),其中的语料初始值为人为设定。
3.根据权利要求1所述的翻译系统中语料推荐方法,其特征在于,步骤B4)中语料和语料提供者的等级单独评定,当语料总得分或语料提供者得分小于等于1万且得分排名小于等于10%为A级,当语料总得分或语料提供者得分小于等于1万且10%<得分排名≦30%为B级,当语料总得分或语料提供者得分小于等于1万且30%<得分排名≦40%为C级;当语料总得分或语料提供者得分大于1万且得分排名小于等于1%为SSS级,当语料总得分或语料提供者得分大于1万且1%<得分排名≦5%为SS级,当语料总得分或语料提供者得分大于1万且5%<得分排名≦10%为S级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510792816.7/1.html,转载请声明来源钻瓜专利网。