[发明专利]一种文档处理方法、装置、设备及存储介质有效
申请号: | 202110359276.9 | 申请日: | 2021-04-02 |
公开(公告)号: | CN112733056B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 吉玉婷;赵永康;马义;李钢江 | 申请(专利权)人: | 北京百家视联科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F40/151;G06F16/14;G06F16/16;G06F16/172 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
地址: | 100082 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 处理 方法 装置 设备 存储 介质 | ||
1.一种文档处理方法,其特征在于,所述方法包括:
从待处理文档中,获取所述待处理文档中包含的图片以及待解析文档,并将获取的每一张图片存储至远程服务器中,其中,所述待处理文档是包含多种不同类型媒体元素的word文档,所述待解析文档是xml格式的所述待处理文档;
针对获取的每一张图片,根据该张图片在所述待处理文档中所处的位置,以及该张图片在所述远程服务器中的存储地址,建立该张图片在所述待解析文档中对应的替换路径;
对所述待解析文档进行解析处理,确定所述待解析文档中各媒体元素对应的xml标签,其中,所述xml标签中至少包括:用于表征公式的公式标签和用于表征图片的图片标签;
基于确定出的每一所述xml标签,以及每张图片对应的所述替换路径,将所述待解析文档转化成目标格式的展示文档,其中,所述目标格式是指能够在网页中向用户展示的文档格式;
其中,当确定出的所述xml标签是所述公式标签时,所述基于确定出的每一所述xml标签,以及每张图片对应的所述替换路径,将所述待解析文档转化成目标格式的展示文档,包括:
针对每一所述公式标签,从所述待解析文档中,获取该公式标签所标记的公式数据行,其中,所述公式数据行是构成目标公式的数字、字母和运算符号的排列组合,所述目标公式是该公式标签在所述待解析文档中对应标记的公式;
利用区域间隔标记,对所述公式数据行中包括的每一个字符进行标记,确定所述公式数据行的分词标记结果,其中,所述区域间隔标记是所述公式标签中用于识别不同类型字符的子标签;
利用层叠样式表,按照所述目标公式的格式,调整所述公式数据行中包括的每一个字符的展示位置,得到用于在网页中进行展示的待导入公式;
在所述展示文档中的第二目标空位处,向用户展示所述待导入公式,其中,所述第二目标空位是所述展示文档中需要插入所述目标公式的位置。
2.根据权利要求1所述的方法,其特征在于,所述从待处理文档中,获取所述待处理文档中包含的图片以及待解析文档,包括:
利用解压工具zipArchive,对所述待处理文档进行解压,得到所述待处理文档中包含的图片以及所述待解析文档。
3.根据权利要求1所述的方法,其特征在于,所述将获取的每一张图片存储至远程服务器中,包括:
根据该张图片在所述待处理文档中所处的位置,确定该张图片在所述待处理文档中的插入顺序;
将该张图片在所述待处理文档中的插入顺序作为该张图片的存储文件名称,存储至所述远程服务器中。
4.根据权利要求3所述的方法,其特征在于,所述根据该张图片在所述待处理文档中所处的位置,以及该张图片在所述远程服务器中的存储地址,建立该张图片在所述待解析文档中对应的替换路径,包括:
利用该张图片在所述待处理文档中的插入顺序,从所述远程服务器中存储的图片的存储文件名称中,查找与所述插入顺序相匹配的存储文件名称作为目标文件名称;
从所述远程服务器中,提取所述目标文件名称的图片所在的存储地址作为目标存储地址;
将提取的所述目标存储地址作为该张图片在所述待解析文档中对应的替换路径,其中,所述替换路径用于在网页中,通过访问远程图片的方式,加载该张图片。
5.根据权利要求1所述的方法,其特征在于,当确定出的所述xml标签是所述图片标签时,所述基于确定出的每一所述xml标签,以及每张图片对应的所述替换路径,将所述待解析文档转化成目标格式的展示文档,包括:
针对每一所述图片标签,获取目标图片对应的所述替换路径,其中,所述目标图片是所述待解析文档中,该图片标签所标记的图片;
利用所述目标图片对应的替换路径,通过远程访问的方式,从所述远程服务器中,查找所述目标图片的替换图片,其中,所述替换图片是可以在网页中加载的所述目标图片;
在所述展示文档中的第一目标空位处,向用户展示查找到的所述替换图片,其中,所述第一目标空位是所述展示文档中需要插入所述目标图片的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百家视联科技有限公司,未经北京百家视联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110359276.9/1.html,转载请声明来源钻瓜专利网。