[发明专利]一种存储文档的方法、装置、电子设备及存储介质在审
申请号: | 202010511841.4 | 申请日: | 2020-06-08 |
公开(公告)号: | CN112783840A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 邓斌 | 申请(专利权)人: | 北京金山办公软件股份有限公司;珠海金山办公软件有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/172;G06F16/51 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 高莺然;马敬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储 文档 方法 装置 电子设备 介质 | ||
本申请实施例提供了一种存储文档的方法、装置、电子设备及存储介质,涉及计算机技术领域,所述方法包括:获取待存储的目标文档,所述目标文档包括多个图像,根据预设的图像识别规则,确定所述多个图像中相同的图像,在所述相同的图像中,确定一个目标图像,删除所述相同的图像中除所述目标图像以外的其他图像,并将所述目标文档中的所述其他图像的引用标识修改为所述目标图像的引用标识。采用本申请可以有效减少目标文档占用的存储空间。
技术领域
本申请涉及计算机技术领域,特别是涉及一种存储文档的方法、装置、电子设备及存储介质。
背景技术
目前,大部分人将自己生活、工作或者学习中收集到的信息以文字或者图片的形式存储到文档中。在存储文档时,电子设备会对文档包含的全部内容进行存储,也即,电子设备会存储文档中包含的各图片。
由于在实际中,同一文档中可能会存在着多张的重复图片。基于上述技术方案,电子设备中会存储多张重复的图片,会浪费电子设备的存储空间。
发明内容
本申请实施例的目的在于提供一种存储文档的方法、装置、电子设备及存储介质,以减少文档所占用的存储空间。具体技术方案如下:
第一方面,提供了一种存储文档的方法,所述方法包括:
获取待存储的目标文档,目标文档包括多个图像。
根据预设的图像识别规则,确定多个图像中相同的图像。
在相同的图像中,确定一个目标图像,删除相同的图像中除目标图像以外的其他图像,并将目标文档中的其他图像的引用标识修改为目标图像的引用标识。
对修改后的目标文档进行存储。
可选的,根据预设的图像识别规则,确定多个图像中相同的图像之前,还包括:
确定多个图像所在的页面索引和在页面中的位置信息。
将多个图像按照数据量大小进行排序。
将多个图像中数据量大小相等的图像划分至同一图像组。
根据预设的图像识别规则,确定多个图像中相同的图像,包括。
针对每个图像组,根据预设的图像识别规则,在该图像组中确定相同的图像。
可选的,根据预设的图像识别规则,确定多个图像中相同的图像,包括:
对于多个图像中的任意两个图像,从两个图像中的第一图像中选取预设数目个第一像素点,并从两个图像中的第二图像中选择与第一像素点位置相同的第二像素点。
若存在第一位置的第一像素点的像素值,与第一位置的第二像素点的像素值不相同,则确定两个图像不相同。
否则,比较第一图像和第二图像中的全部像素点。
若存在第二位置的第一像素点的像素值,与第二位置的第二像素点的像素值不相同,则确定两个图像不相同;否则,确定两个图像为相同的图像。
可选的,将目标文档中的其他图像的引用标识修改为目标图像的引用标识,包括:
确定其他图像在目标文档中的目标位置信息,目标位置信息包括页面索引和其他图像在页面中的页面位置。
将目标位置信息对应的引用标识修改为目标图像的引用标识。
可选的,所述方法还包括:
当接收到用户输入的对应目标文档的显示指令时,根据目标位置信息对应的目标图像的引用标识,获取目标图像。
在目标文档中的目标位置信息对应的位置处,显示目标图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山办公软件股份有限公司;珠海金山办公软件有限公司,未经北京金山办公软件股份有限公司;珠海金山办公软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010511841.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示表单域的方法、装置、电子设备及介质
- 下一篇:一种芦笋采集收割装置