[发明专利]一种利于翻译工作的文件抽取和还原方法有效
申请号: | 201510357672.2 | 申请日: | 2015-06-25 |
公开(公告)号: | CN104933041B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 江潮;罗伟峰 | 申请(专利权)人: | 武汉传神信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 房德权 |
地址: | 430074 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及利于翻译工作的人工智能、文档处理的方法,利用Aspose组件对文档处理的操作支持,将待翻译的文档对象拆解成以单句为最小单位的待翻译数据集合;建立一个标准的译员处理文档,将的待翻译数据集合中的每一个句子逐一复制到译员处理文档;译员在译员处理文档中逐个填写到译文;遍历所述待翻译数据集合和译员处理文档,写到待翻译数据集合中;将待翻译数据集合还原生成原稿格式文档。本发明能将多种不同格式的文稿转换成为标准的译员处理文档。重复出现多次的句子无需多次重复翻译,简化译员的翻译工作,提升了翻译效率;抽取和还原逻辑的执行效率高;还原的译稿保留原稿格式。 | ||
搜索关键词: | 一种 利于 翻译 工作 文件 抽取 还原 方法 | ||
【主权项】:
一种利于翻译工作的文件抽取和还原方法,其特征在于,包括以下步骤:1)利用Aspose动态链接库对文档处理的操作支持,将待翻译的文档对象拆解成以单句为最小单位的待翻译数据集合;所述将待翻译的文档对象拆解成以句为最小单位的待翻译数据集合,包括以下步骤:1‑1调用Aspose组件;1‑2遍历所述文档对象,得到全部段落对象,所述段落对象包含文档对象全部的文字信息,而不包括无需翻译的符号、图像或其它非文字信息;1‑3遍历每一个段落对象的子节点对象,从而得到若干个的字符集合对象Run;1‑4遍历每一个Run对象,将全部Run对象拆分成一个个仅包含有一个完整的句子的Run对象,或者为仅包含有一个句子片段的Run对象;1‑5遍历每一个Run对象,将仅包含有句子片段的Run对象合并到其后续的仅包含有一个完整的句子的Run对象中;2)建立一个译员处理文档,所述译员处理文档设有“原文”、“译文”和id三个字段,所述“原文”字段对应句子原文,“译文”字段对应句子译文;3)将所述以单句为最小单位的待翻译数据集合中的每一个句子按顺序逐一复制到所述译员处理文档的“原文”字段,然后将待翻译数据集合中该句子的内容用一个具有唯一性的占位符号Guid替代,且相邻的占位符号Guid具有不同的字符格式;所述id字段的内容与所述不同的Guid之间具有一一映射的关系;4)将所述译员处理文档下发到译员,所述译员在所述译员处理文档中逐个翻译“原文”字段的原文,填写到对应的“译文”字段,直到处理完成;5)遍历所述待翻译数据集合和译员处理文档,根据不同Guid对应的不同id,找到该id对应的译文,覆盖写到所述待翻译数据集合中该对应Guid的位置;6)调用Aspose动态链接库,将所述待翻译数据集合还原生成原稿格式文档。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉传神信息技术有限公司,未经武汉传神信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510357672.2/,转载请声明来源钻瓜专利网。
- 上一篇:中文地址分词标注方法
- 下一篇:具有送线供气导引选择机构的缝纫机结构