[发明专利]翻译系统中语料推荐方法有效

专利信息
申请号: 201510792816.7 申请日: 2015-11-18
公开(公告)号: CN105335357B 公开(公告)日: 2018-07-06
发明(设计)人: 张马成;王兴强;屈耕;熊易 申请(专利权)人: 成都优译信息技术有限公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 谢敏
地址: 610000 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了翻译系统中语料推荐方法,包括如下步骤:A)在翻译系统中对用户输入的语料搜索语料库;B)按匹配算法返回语料内容,其中匹配算法采用以自然语言处理方法和评价排名结合的综合推荐机制,自然语言处理方法是找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配的语料,句句权重则是计算输入语料和采用语料之间的采用/展示比的值。本发明通过上述原理,在翻译系统中采用该种语料推荐方法,语料匹配度高,语料翻译更准确。
搜索关键词: 语料 翻译系统 自然语言处理 匹配算法 权重 匹配 语料翻译 返回 匹配度 语料库 实词 搜索 展示
【主权项】:
1.翻译系统中语料推荐方法,其特征在于,包括如下步骤:在翻译系统中对用户输入的语料搜索语料库;按匹配算法返回语料内容,其中匹配算法采用以自然语言处理方法和评价排名结合的综合推荐机制,自然语言处理方法是找到某一语料的核心实词,与用户输入进行句句权重匹配后返回匹配的语料,句句权重则是计算输入语料和采用语料之间的采用/展示比的值,评价排名的方法包括如下步骤:B1)上传需要翻译的语料到翻译系统中;B2)在翻译系统中的已有语料中查找是否有重复的需要翻译的语料,对于已重复的语料则在该语料总得分上加0.1倍语料重复得分,在语料提供者得分上减0.3倍重复得分;B3)在使用语料的过程中,采用pagerank思想,针对提供者和语料本身计算各自得分,每当有语料被展示一次,在该语料总得分上减0.1倍语料展示得分,该语料被采用一次,则在语料总得分上加上0.8倍语料采用得分且在语料提供者得分上加0.7倍采用得分,语料提供者得分=采用得分*0.7‑重复得分*0.3+上传得分*0.2+语料提供者初始值,其中的采用得分=sum(该语料提供者的某一语料被使用的次数/该语料被展示次数),其中的重复得分=sum(重复语料的上传人数个数/被上传次数),其中的上传得分=log(上传语料数);B4)基于步骤B3)算出语料总得分和语料提供者得分,根据得分得出语料和语料提供者的等级。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510792816.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top