[发明专利]一种背景相似图片的聚类方法、装置及电子设备、存储介质有效
申请号: | 202110729370.9 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113672751B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 田春霖;蒋泽锟;严宋扬;阮书宁 | 申请(专利权)人: | 西安深信科创信息技术有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710000 陕西省西安市高新区鱼*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 背景 相似 图片 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种背景相似图片的聚类方法、装置及电子设备、存储介质,该聚类方法包括:构建无向图G,其中,所述无向图G用邻接矩阵表示,图片为所述无向图G的节点;将所述无向图G中核心度小于k0的节点全部移除,得到若干子图G1,其中,所述子图G1为强关系簇,k0为亲和度与频数关系图的转折点;根据所述亲和度与频数关系图的高置信度阈值将第一非强关系节点划分进入对应的所述子图G1,其中,所述高置信度阈值为所述亲和度与频数关系图的最高点。本发明将结合强相关子图算法,挖掘不同图片之间的强关联关系,在邻接矩阵已获得的基础上,使用不相关子图算法找到对应实体的强关系,对图片进行聚类并解决“正常图片”问题。
技术领域
本发明属于数字图像处理技术领域,具体涉及一种背景相似图片的聚 类方法、装置及电子设备、存储介质。
背景技术
目前,在图片背景聚类上,一般使用较为常见的聚类算法,例如k-均值 (k-means)、k-中心(k-medoids)、谱聚类、亲和度扩散聚类算法(Affinity Propagation)等处理特征信息。
这些聚类算法不能很好地应对图背景聚类上的“正常图片”问题,“正 常图片”即在图片背景聚类中存在大量的不属于任意聚类簇的图片,一般聚 类算法对这类图片不能很好地处理。
常见的聚类算法不能很好地应对图背景聚类上的“正常图片”问题,“正 常图片”即正常办理业务的图片,这类图片占图片的绝大部分且不属于任意 欺诈聚类簇,它们会在很大程度上影响最终结果。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种背景相似图 片的聚类方法、装置及电子设备、存储介质。本发明要解决的技术问题通过 以下技术方案实现:
一种背景相似图片的聚类方法,包括:
构建无向图G,其中,所述无向图G用邻接矩阵表示,图片为所述无向 图G的节点;
将所述无向图G中核心度小于k0的节点全部移除,得到若干子图G1,其 中,所述子图G1为强关系簇,k0为亲和度与频数关系图的转折点;
根据所述亲和度与频数关系图的高置信度阈值将第一非强关系节点划 分进入对应的所述子图G1,其中,所述高置信度阈值为所述亲和度与频数 关系图的最高点。
在本发明的一个实施例中,将无向图G中核心度小于k0的节点全部移除, 得到子图G1,包括:
获取亲和度与频数关系图;
计算所述亲和度与频数关系图的转折点;
将所述无向图G中核心度小于所述亲和度与频数关系图的转折点的节 点全部移除,得到所述若干子图G1。
在本发明的一个实施例中,获取亲和度与频数关系图,包括:
统计每一个所述节点到其余各个所述节点的亲和度;
根据所有所述亲和度与所有频数得到所述亲和度与频数关系图。
在本发明的一个实施例中,计算所述亲和度与频数关系图的转折点,包 括:
通过佩蒂特算法计算所述亲和度与频数关系图的转折点。
在本发明的一个实施例中,根据所述亲和度与频数关系图的高置信度 阈值将第一非强关系节点划分进入对应的所述子图G1,包括:
在所述亲和度与频数关系图中找到所述高置信度阈值;
统计所述第一非强关系节点中亲和度大于所述高置信度阈值的节点, 得到第二非强关系节点;
计算所述第二非强关系节点和所有所述子图G1中节点之间的亲和度, 以得到所述第二非强关系节点和每个所述子图G1中节点的最小亲和度m;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安深信科创信息技术有限公司,未经西安深信科创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110729370.9/2.html,转载请声明来源钻瓜专利网。