[发明专利]一种双语合并文档的合并方法在审
申请号: | 202111462100.2 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114118112A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 胡永伟 | 申请(专利权)人: | 江苏省舜禹信息技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F40/18;G06F40/109 |
代理公司: | 南京专信知识产权代理有限公司 32605 | 代理人: | 郝晓燕 |
地址: | 210019 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 双语 合并 文档 方法 | ||
本发明公开了一种双语合并文档的合并方法包括:源数据文档,翻译文档,翻译文档为经翻译源数据文档后获得的文档;校正文档,将翻译文档结合翻译软件和专业翻译人员比对修订后的文本;基于源数据文档和校正文档提取的内容信息和附加信息,根据所获得的内容信息和附加信息,生成待合并的中间文档;基于中间文档,结合源数据文档和校正文档中的断句符号,对齐原文和译文,获得合并文档。系统可以对原文、译文按照指定的断句符号进行对齐,并在此基础上,根据翻译的特性以专用的词汇作为节点划分章节,按章节来进行合并,使得合并的功能更智能,合并的内容更加符合用户的需要。
技术领域
本发明涉及一种对word文档的合并对齐,用户可以根据翻译的固定格式设定对齐的文档。
背景技术
对于翻译好的原文和译文,需要将其按照句子一一对齐。目前针对双语对齐的方式可以采用word本身的一些方法,这需要使用人需掌握精通的word技巧,且双语合并后的语序往往不能一致。对于一些语法上先后顺序有所调整的稿件来说,合并完的稿件改动很大。且句与句之间的错位会给使用者带来极大的困扰。
发明内容
本发明所要解决的技术问题是提供一种双语合并文档的合并方法,用户可以根据翻译的固定格式设定对齐的文档。
为解决上述技术问题,本发明的技术方案为:一种双语合并文档的合并方法,其创新点在于,合并方法包括:
源数据文档,所述源数据文档为原始中文文档;
翻译文档,所述翻译文档为经翻译源数据文档后获得的文档;
校正文档,将所述翻译文档结合翻译软件和专业翻译人员比对修订后的文本;
基于所述源数据文档和所述校正文档提取的内容信息和附加信息,根据所获得的内容信息和附加信息,生成待合并的中间文档;
基于中间文档,结合所述源数据文档和所述校正文档中的断句符号,对齐原文和译文,获得合并文档。
优选的,所述源数据文档为中文文档,所述翻译文档为英文文档、日文文档中的一种;所述源数据文档为英文文档,所述翻译文档为中文文档、日文文档中的一种。
优选的,所述合并文档获取过程中的断句符号结合专用的词汇作为节点划分章节,且合并过程中按照章节进行合并。
优选的,所述合并文档合并完成后,微调双语对齐间隙或者空格。
优选的,所述微调操作包括在合并文档中直接微调或者另存为输出文档,输出文档以表格形式显示双语对齐。
优选的,所述输出文档中的内容信息和附加信息链接所述合并文档,所述输出文档基于网关传输链接所述合并文档。
优选的,所述网关传输为基于网络协议的内网传输、基于有线或者无线的外网传输、基于公有云或者私有云的云传输。
本发明的优点在于:系统可以对原文、译文按照指定的断句符号进行对齐,并在此基础上,根据翻译的特性(例如:英译中、日译中、日译英等等),以专用的词汇作为节点划分章节,按章节来进行合并,使得合并的功能更智能,合并的内容更加符合用户的需要。对于合并后的双语语料,用户可以在系统上进行微调,也可以直接导出成word表格的形式,直接在表格上进行快速的调整,以达到最佳效果。
具体实施方式
本发明的双语合并文档的合并方法包括:
源数据文档,所述源数据文档为原始中文文档;
翻译文档,所述翻译文档为经翻译源数据文档后获得的文档;
校正文档,将所述翻译文档结合翻译软件和专业翻译人员比对修订后的文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省舜禹信息技术有限公司,未经江苏省舜禹信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111462100.2/2.html,转载请声明来源钻瓜专利网。