[发明专利]重复图片删除方法、装置、设备及存储介质有效
申请号: | 202110482261.1 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113110804B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 廖琼 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F16/35;G06Q50/26 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重复 图片 删除 方法 装置 设备 存储 介质 | ||
本申请涉及数据处理技术,提供一种重复图片删除方法、装置、计算机设备与存储介质,包括:扫描若干个项目文件中的所有图片,得到图片集;解析图片集,得到每张图片的图片特征,并根据图片特征进行聚类处理,得到目标聚类簇;获取目标聚类簇中每张图片的位置信息,并根据位置信息确定最优删除策略;根据所述最优删除策略将所述目标位置信息处的所述待删除图片替换为所述基准图片,并删除同一所述项目文件中重复的所述基准图片。本申请能够提高重复图片删除的效率,促进智慧城市的快速发展。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种重复图片删除方法、重复图片删除装置、计算机设备及计算机可读存储介质。
背景技术
在项目进展过程中,随着项目版本的不断更新迭代,针对项目开发的应用程序(Application,简称APP)会出现很多废弃的图片,如未被引用图片或者重复的图片,这些废弃的图片占用了APP的大部分体积。由于这些废弃图片占用的体积较大,需要将这些废弃图片删除以减少APP的体积。
在实现本发明的过程中,发明人发现现有技术至少存在以下技术问题:目前的废弃图片删除主要是针对未被引用图片的情况进行处理,缺少对图片有用但图片重复的处理方案。
因此,有必要提供一种项目重复图片删除方法,能够提高项目重复图片的删除效率。
发明内容
鉴于以上内容,有必要提出一种重复图片删除方法、重复图片删除装置、计算机设备及计算机可读存储介质,能够提高重复图片删除的效率。
本申请实施例第一方面提供一种重复图片删除方法,应用于目标服务器中,所述重复图片删除方法包括:
扫描若干个项目文件中的所有图片,得到图片集;
解析所述图片集,得到每张图片的图片特征,并根据所述图片特征进行聚类处理,得到目标聚类簇;
获取所述目标聚类簇中每张图片的位置信息,并根据所述位置信息确定最优删除策略,所述最优删除策略包括基准图片、目标待删除图片以及所述目标待删除图片的目标位置信息;
根据所述最优删除策略将所述目标位置信息处的所述目标待删除图片替换为所述基准图片,并删除同一所述项目文件中重复的所述基准图片。进一步地,在本申请实施例提供的上述重复图片删除方法中,所述扫描若干个项目文件中的所有图片,得到图片集包括:
接收应用服务器发出的图片扫描指令;
根据所述图片扫描指令开启预设Shell命令解释器;
调用所述预设Shell命令解释器扫描若干个项目文件中的所有图片,得到图片集。
进一步地,在本申请实施例提供的上述重复图片删除方法中,所述根据所述图片特征进行聚类处理,得到目标聚类簇包括:
获取关于所述图片特征的特征说明文档;
基于预设的TF-IDF算法处理所述特征说明文档,计算每一项图片特征的词频与逆向文件频率;
将所述词频与所述逆向文件频率输入至预设权重计算模型中,得到所述图片特征的预设权重值;
选取所述预设权重值大于预定权重阈值的图片特征作为目标图片特征,并以所述目标图片特征为聚类基准进行聚类处理,得到目标聚类簇。
进一步地,在本申请实施例提供的上述重复图片删除方法中,所述获取所述目标聚类簇中每张图片的位置信息包括:
获取所述目标聚类簇中每张图片的属性信息;
解析所述属性信息,并检测所述属性信息中是否包含预设标记;
当检测结果为所述属性信息中包含所述预设标记时,确定所述预设标记处的信息为每张图片的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482261.1/2.html,转载请声明来源钻瓜专利网。