[发明专利]富文本文档的翻译方法及装置在审
申请号: | 202110797431.5 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113536811A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李华顺 | 申请(专利权)人: | 杭州隆埠科技有限公司 |
主分类号: | G06F40/40 | 分类号: | G06F40/40;G06F40/56;G06F40/126 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 王思超 |
地址: | 310030 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 文档 翻译 方法 装置 | ||
本申请公开了一种富文本文档的翻译方法及装置,所述翻译方法包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。
技术领域
本申请涉及网页翻译技术领域,尤其涉及一种富文本文档的翻译方法及装置。
背景技术
在常见的超文本标记语言(Hyper Text Mark-up Language,HTML)格式的富文本文档中,其内容一般包括文字、图片、视频、超级链接、表格、有序/无序列表以及复杂的样式等多种信息。而翻译HTML格式的富文本文档只需要对文档中的文字进行处理即可。
在相关技术中,大多数服务只能解决纯文本格式的翻译,少量提供富文本格式支持的服务需要额外的费用,并且在翻译完成后可能会导致文档的排版发生变化。
发明内容
本申请公开一种富文本文档的翻译方法及装置,解决了在对富文本文档翻译完成后可能会导致文档的排版发生变化的问题。
为了解决上述问题,本申请采用下述技术方案:
第一方面,本申请实施例公开一种富文本文档的翻译方法,包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。
第二方面,本申请实施例公开一种富文本文档的翻译装置,包括:第一获取模块,用于获取待翻译的富文本文档;提取模块,用于提取所述富文本文档中的第一语言的各个第一纯文本字符串;第二获取模块,用于获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;替换模块,用于使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。
本申请采用的技术方案能够达到以下有益效果:
本申请实施例提供一种富文本文档的翻译方法,包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。本申请通过使用与从待翻译的富文本文档中提取的第一语言的各个第一纯文本字符串对应的第二语言的第二纯文本字符串替换富文本文档中的对应的第一纯文本字符串,有效解决了在对富文本文档翻译完成后可能会导致文档的排版发生变化的问题。
附图说明
图1为本申请实施例公开的一种富文本文档的翻译方法的流程示意图;
图2为本申请实施例公开的文档对象中文本节点的示意图;
图3为本申请实施例公开的提取出的第一纯文本字符串数组的示意图;
图4为本申请实施例公开的将各个第一纯文本字符串分别替换为占位符的示意图;
图5为本申请实施例公开的将各个第一纯文本字符串中的文本组合为第一字符串文本的示意图;
图6为本申请实施例公开的与第一字符串文本对应的第二字符串文本的示意图;
图7为本申请实施例公开的使用第二纯文本字符串替换富文本文档中的对应第一纯文本字符串的示意图;
图8为本申请实施例公开的翻译效果的示意图;
图9为本申请实施例公开的一种富文本文档的翻译装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州隆埠科技有限公司,未经杭州隆埠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110797431.5/2.html,转载请声明来源钻瓜专利网。