[发明专利]文档处理方法以及装置有效
申请号: | 201810173169.5 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108334481B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 屈耕 | 申请(专利权)人: | 四川语言桥信息技术有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/126 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 方法 以及 装置 | ||
1.一种文档处理方法,其特征在于,所述方法包括:
将预先获取到的待处理文档进行识别,得到所述待处理文档中的目标节点,所述目标节点至少包括段落节点、文本和文本样式节点以及文本节点;
基于预先保存的标识符生成算法,对所述目标节点中的每个节点标记唯一性标识;
将添加唯一性标识后的待处理文档进行加密处理,得到加密文档;
将所述加密文档按照节点的不同分别保存在预先设置的标签模型内;
获取与所述待处理文档对应的译文;
将所述译文与保存在所述标签模型内的所述文本节点进行替换;
对进行替换后的所述加密文档进行解密后,基于所述唯一性标识,将替换后的所述加密文档进行还原;
所述将添加唯一性标识后的待处理文档进行加密处理,得到加密文档,包括:将添加唯一性标识后的待处理文档生成Base64编码,得到加密文档;
在所述将预先获取到的待处理文档进行识别,得到所述待处理文档中的目标节点之前,所述方法还包括:在判断所述待处理文档不包括文本和文本样式节点时,在所述文本节点外层添加文本和文本样式节点。
2.根据权利要求1所述的方法,其特征在于,所述基于预先保存的标识符生成算法,对所述目标节点中的每个节点标记唯一性标识,包括:
基于全局唯一标识符,对所述目标节点中的每个节点标记唯一性标识。
3.根据权利要求2所述的方法,其特征在于,所述预先设置的标签模型内包括段落子模型、文本和文本样式子模型以及文本子模型,将所述加密文档按照节点的不同分别保存在预先设置的标签模型内,包括:
将所述段落节点保存在所述段落子模型内,将所述文本和文本样式节点保存在所述文本和文本样式子模型内,将所述文本节点保存在所述文本子模型内。
4.一种文档处理装置,其特征在于,所述装置包括:
识别模块,用于将预先获取到的待处理文档进行识别,得到所述待处理文档中的目标节点,所述目标节点至少包括段落节点、文本和文本样式节点以及文本节点;
标记模块,用于基于预先保存的标识符生成算法,对所述目标节点中的每个节点标记唯一性标识;
加密模块,用于将添加唯一性标识后的待处理文档进行加密处理,得到加密文档;
保存模块,用于将所述加密文档按照节点的不同分别保存在预先设置的标签模型内;
获取模块,用于获取与所述待处理文档对应的译文;
替换模块,用于将所述译文与保存在所述标签模型内的所述文本节点进行替换;
还原模块,用于对进行替换后的所述加密文档进行解密后,基于所述唯一性标识,将替换后的所述加密文档进行还原;
所述加密模块,具体用于将添加唯一性标识后的待处理文档生成Base64编码,得到加密文档;
所述装置还包括:判断模块,用于在判断所述待处理文档不包括文本和文本样式节点时,在所述文本节点外层添加文本和文本样式节点。
5.根据权利要求4所述的装置,其特征在于,
所述标记模块,具体用于:基于全局唯一标识符,对所述目标节点中的每个节点标记唯一性标识。
6.根据权利要求5所述的装置,其特征在于,所述预先设置的标签模型内包括段落子模型、文本和文本样式子模型以及文本子模型,所述保存模块,用于将所述段落节点保存在所述段落子模型内,将所述文本和文本样式节点保存在所述文本和文本样式子模型内,将所述文本节点保存在所述文本子模型内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川语言桥信息技术有限公司,未经四川语言桥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810173169.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网页信息提取的方法及装置
- 下一篇:一种电子批文生成方法和装置