[发明专利]一种用于英语翻译的文本数据处理方法有效
申请号: | 201510006001.1 | 申请日: | 2015-01-07 |
公开(公告)号: | CN104503960B | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 姜华;程迎新;单畅;丛岩;李一飞;胡帅;项睿;李峰华 | 申请(专利权)人: | 渤海大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙)11369 | 代理人: | 史霞 |
地址: | 121000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 英语翻译 文本 数据处理 方法 | ||
技术领域
本发明属于英语翻译领域,特别涉及一种用于英语翻译的文本数据处理方法。
背景技术
随着国际交流的不断深入,对英语文件的翻译需求也越来越大,促使了一大批英语翻译工具的出现,这些英语翻译工具通常分为在线版和本地版,而无论在线版还是本地版都是在数据库中搜索译文进行翻译,这些翻译工具的出现极大的满足了用户的翻译需求,对提高翻译效率,推动社会进步作出了贡献。
而由于英语的语法、规则众多,翻译工具的数据库中不一定能完全匹配到需要翻译的语句,基本上都是将待翻译语句进行一对一的单词翻译,时态和语序经常会发生错误,并且翻译生硬,达不到翻译中常说的信、达、雅的要求,此时还需要有英语基础的用户进行逐句的校对,理顺语序,调整时态,根据自己的语法知识重新组织语言,而对于英语基础差的人来说就无能为力了。
请专业的翻译人员进行人工翻是另一种对资料翻译的方法,只是目前请专业的翻译人员进行翻译还需要付昂贵的佣金,并且需等待较长时间,翻译人员的水平也参差不齐,翻译人员的主观意识也会对翻译结果产生影响。因此目前急需一种经济、快捷、又能保证准确定的英语翻译方法。
发明内容
为了解决上述问题,本发明提供了一种用于英语翻译的文本数据处理方法,该方法提高了翻译的准确性,提高了翻译效率。
本发明解决其技术问题采用的技术方案是:提供一种用于英语翻译的文本数据处理方法,包括如下步骤:
步骤一、对第一用户上传的文件进行文字识别,获得第一文本信息;
步骤二、对所述第一文本信息进行分割,识别所述第一文本信息中的标点,以句号为分割位置,得到以句子为单位的第二文本信息;
步骤三、根据所述第二文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,若有则将该目标语句作为第三文本信息进行输出,否则转步骤四;
步骤四、系统对第二文本信息每个句子按照翻译难度进行分类,第二用户选择擅长的领域及适当的难度,对所述第二文本信息进行人工翻译,翻译文本作为第四文本信息输出,并且所述第四文本信息作为目标语句存入所述数据库。
优选的是,步骤四中所述第二用户可以修改第三文本信息,并作为第五文本信息进行输出,所述第五文本信息作为目标语句存入所述数据库中;
优选的是,第一用户对所述第三文本信息、第四文本信息、第五文本信息以句子为单位进行目标语句置信度评分,所述置信度评分信息连同目标语句存入所述数据库;
优选的是,所述第一用户账户内的一定积分转移到所述第二用户账户内,作为所述第二用户翻译所述第二文本、第三文本的奖励,第一用户根据句子的难度调整奖励积分的多少。
优选的是,所述第一用户对所述第三文本的置信度评分,与该文本原始的置信度评分进行加权计算处理,并作为新的置信度评分信息存入所述数据库,加权计算按照如下公式:
其中,i为评分的次数,Xi为经i次评分后的置信度评分,ai为第一用户的评分,A为置信度评分的满分,σi为偏置度,c为常数,e为欧拉数。
优选的是,存储于所述数据库内的同一语句的多个翻译目标文本,根据置信度评分信息进行排列,置信度评分高的翻译目标文本替换掉置信度评分低的翻译目标文本。
本发明的有益效果在于:一种用于英语翻译的文本数据处理方法将第一用户上传的文件以句子为单位进行分割,降低了后续搜索翻译的难度,数据库中搜索到对应的目标文本会直接进行输出,从而得到翻译结果,快速高效的实现文本的翻译,节省了翻译成本和时间。未搜索到对应目标文本由第二用户进行人工翻译,来保证翻译的准确性及语法的正确性。第二用户翻译的结果会作为目标语句存入数据库中,使数据库不断得到扩充,从而增大了后续文本搜索的匹配度,减少第二用户人工翻译的量。第一用户对输出的目标文本进行置信度评分,置信度评分信息随目标文本一并存入数据库,相同语句的多种目标文本间会根据置信度评分信息进行排序及替换,使数据库得到优化,提高了翻译的准确性。本发明充分发挥了机器翻译与人工翻译各自的优势,并且随着数据库的不断扩充及优化,会逐渐减少人工翻译的量,实现快捷、准确、经济的翻译方法。
附图说明
图1是本发明一种用于英语翻译的文本数据处理方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案作具体阐述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海大学,未经渤海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510006001.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种相关实体推荐方法和系统
- 下一篇:一种文档操作同步方法及装置