[发明专利]一种背景相似图片的聚类方法、装置及电子设备、存储介质有效
申请号: | 202110729370.9 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113672751B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 田春霖;蒋泽锟;严宋扬;阮书宁 | 申请(专利权)人: | 西安深信科创信息技术有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710000 陕西省西安市高新区鱼*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 背景 相似 图片 方法 装置 电子设备 存储 介质 | ||
1.一种背景相似图片的聚类方法,其特征在于,包括:
构建无向图G,其中,所述无向图G用邻接矩阵表示,无向图G包括节点和边,图片为所述无向图G的节点,边为图片之间的关联度,关联度越大,图片之间的相似度越大;
将所述无向图G中核心度小于k0的节点全部移除,得到若干子图G1,其中,所移除的节点为第一非强关系节点,所述子图G1为强关系簇,k0为亲和度与频数关系图的转折点;
根据所述亲和度与频数关系图的高置信度阈值将第一非强关系节点划分进入对应的所述子图G1,其中,所述亲和度为邻接矩阵的元素,所述亲和度和所述节点之间的距离成反比,所述频数为邻接矩阵中每个元素出现的次数,所述高置信度阈值为所述亲和度与频数关系图的最高点;
根据置信度计算公式得到每个所述节点的置信度,所述置信度计算公式为:
其中,p表示置信度,x表示节点属于对应强关系簇的亲和度,t1、t2表示所述亲和度与频数关系图的最高点和所述亲和度与频数关系图的转折点,t表示归并为所述亲和度与频数关系图的最高点或者所述亲和度与频数关系图的转折点时,则t使用所述亲和度与频数关系图的最高点或所述亲和度与频数关系图的转折点对应的亲和度;
其中,根据所述亲和度与频数关系图的高置信度阈值将第一非强关系节点划分进入对应的所述子图G1,包括:
在所述亲和度与频数关系图中找到所述高置信度阈值;
统计所述第一非强关系节点中亲和度大于所述高置信度阈值的节点,得到第二非强关系节点;
计算所述第二非强关系节点和所有所述子图G1中节点之间的亲和度,以得到所述第二非强关系节点和每个所述子图G1中节点的最小亲和度m;
将所述第二非强关系节点归并进入所有所述最小亲和度m中的最大亲和度所对应的所述子图G1中。
2.根据权利要求1所述的背景相似图片的聚类方法,其特征在于,将无向图G中核心度小于k0的节点全部移除,得到子图G1,包括:
获取亲和度与频数关系图;
计算所述亲和度与频数关系图的转折点;
将所述无向图G中核心度小于所述亲和度与频数关系图的转折点的节点全部移除,得到所述若干子图G1。
3.根据权利要求2所述的背景相似图片的聚类方法,其特征在于,获取亲和度与频数关系图,包括:
统计每一个所述节点到其余各个所述节点的亲和度;
根据所有所述亲和度与所有频数得到所述亲和度与频数关系图。
4.根据权利要求2所述的背景相似图片的聚类方法,其特征在于,计算所述亲和度与频数关系图的转折点,包括:
通过佩蒂特算法计算所述亲和度与频数关系图的转折点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安深信科创信息技术有限公司,未经西安深信科创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110729370.9/1.html,转载请声明来源钻瓜专利网。