[发明专利]一种在线辅助翻译的译文实时预览方法有效
申请号: | 202010260294.7 | 申请日: | 2020-04-03 |
公开(公告)号: | CN111401000B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 陈件;张井;成延;刘旻 | 申请(专利权)人: | 上海一者信息科技有限公司 |
主分类号: | G06F40/106 | 分类号: | G06F40/106;G06F40/154;G06F40/47 |
代理公司: | 上海骁象知识产权代理有限公司 31315 | 代理人: | 柏祝扣 |
地址: | 200090 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 辅助 翻译 译文 实时 预览 方法 | ||
本发明公开了一种在线辅助翻译的译文实时预览方法,涉及计算机辅助翻译领域,包括如下步骤:将原文文件通过文件格式转换器转换成HTML,将原文解析并分句成按句划分的句段Segment数组,利用循环递归算法,将句段Segment的中元素id埋到转换后的HTML子标签中,形成一一对应的关系,前端通过HTML的dom节点来实现句段Segment和HTML之间的联动,达到实时预览译文的效果;本发明提供了一种算法,可以将辅助翻译中的译文实时的渲染到浏览器中,供译员查看和参考,极大的节省了翻译的时间,有着非常明显的效率提升。
技术领域
本发明涉及计算机辅助翻译领域,特别涉及一种在线辅助翻译的译文实时预览方法。
背景技术
当代计算机辅助翻译,需要将文字提取出来,给译者翻译成指定目标语言以后,再将译文填充回去。通常情况下,译者在翻译过程中无法在编辑器里查看翻译文件的原文和译文。传统的做法是通过文件转换的方法,将原文转换成html格式并通过浏览器渲染给翻译人员查看。但是,翻译人员在编辑过程中形成的译文是无法实时查看的。
发明内容
本发明实例提供了一种在线辅助翻译的译文实时预览方法。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本发明实施例的第一方面,提供了
一种在线辅助翻译的译文实时预览方法,包括如下步骤:
将原文文件转换成HTML格式;
将原文解析并分句成按句划分的句段Segment数组;
利用循环递归算法,将所述句段Segment的中元素id埋到所述HTML格式文件中的子标签中,形成一一对应的关系;
通过HTML的dom节点来实现句段Segment和HTML之间的联动,达到实时预览译文的效果。
优选地,所述原文文件格式是doc、docx、rtf、xls、xlsx、ppt、pptx、pdf、sxw、stw、sxc、stc。
优选地,所述将原文文件转换成HTML格式,具体方法为利用word自身的转换功能或者其他第三方工具进行转换。
优选地,所述将原文解析并分句成按句划分的句段Segment数组,具体为将所述分句成按句划分的句段Segment为单词、短语或句子。
优选地,所述句段Segment数组为句段列表,记录句段Segment的文本内容和对应的文本标号。
优选地,所述循环递归算法包括如下步骤:
定义Atom类型的类,这个类有两个类型定义为标签Tag和文本;
将句段列表中的句段Segment内容定义为Atom的文本,句段Segment的标号定义为Atom的标签Tag;
算法会循环读取每个Atom,根据Atom的类型来判断是否放入文本池;
将文本池中的每个Atom与Atom的标签Tag对应,最终形成一个新的带id映射的HTML子标签的集合。
优选地,所述类Atom为自定义类。
优选地,所述每个句段Segment是由一个或者多个Atom组成。
优选地,所述HTML的子标签是由一个Atom的标签Tag构成。
优选地,所述句段Segment和HTML之间的联动的方法为:将Atom的标签Tag嵌入到HTML子标签中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海一者信息科技有限公司,未经上海一者信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010260294.7/2.html,转载请声明来源钻瓜专利网。