[发明专利]一种基于皮尔逊相关系数的语义视觉词典优化方法有效
申请号: | 201910586981.5 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110288045B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 唐朝晖;刘亦玲;高小亮;范影;唐励雍;李耀国 | 申请(专利权)人: | 中南大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/764 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吝秀梅 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 皮尔逊 相关系数 语义 视觉 词典 优化 方法 | ||
1.一种基于皮尔逊相关系数的语义视觉词典构建方法,其特征在于包括以下步骤:
步骤A、使用加速鲁棒特征算法提取图像动态特征R={r1,r2,…,ri,…,rN-1,rN},同时提取基于图像颜色、形状和纹理的图像底层特征集S={s1,s2,s3},s1,s2,s3分别为图像颜色、形状和纹理特征;
步骤B、使用精确欧式局部敏感哈希聚类算法对获取的图像动态特征聚类,得到原始视觉词典;
步骤C、采用皮尔逊相关系数相关度求取原始视觉词典中视觉短语间相关度大小|ρn|,设定阈值ratio1,若|ρn|<ratio1,将此视觉短语加入新建的视觉短语集合;
步骤D、若|ρn|≥ratio1,再将此视觉短语对应的动态特征与图像底层特征——颜色、形状、纹理特征再求取皮尔逊相关度|ρ′n|,设定阈值ratio2,若|ρ′n|>ratio2,则将此视觉短语加入视觉短语集合,优化原始视觉词典中的视觉短语,构建新的语义视觉词典。
2.根据权利要求1所述的一种基于皮尔逊相关系数的语义视觉词典构建方法,其特征在于,所述步骤B包括:
步骤B1、用加速鲁棒特征算法提取图像动态特征构成动态特征集R={r1,r2,…,ri,…,rN-1,rN},其中,ri是图像的一个动态特征,N为特征集R中特征个数;
步骤B2、从E2LSH聚类算法中的函数集G中随机选取一个位置敏感函数g;
步骤B3、用位置敏感函数g求取图像动态特征集R中图像特征ri对应的k维向量g(ri);
步骤B4、计算ri的主哈希值h1(g(ri))和次哈希值h2(g(ri)),将R中主、次哈希值都相同的动态特征放入同一个桶bk中,bk即是视觉短语;
步骤B5、求取所有图像动态特征的桶bk构成原始视觉词典Tg={b1,b2,…,bk,…,bz}。
3.根据权利要求2所述的一种基于皮尔逊相关系数的语义视觉词典构建方法,其特征在于,所述步骤C包括:
步骤C1、对原始视觉词典Tg={b1,b2,…,bk,…,bZ}中的任意一个视觉短语bk,根据公式计算该视觉短语与原始视觉词典中其它视觉短语之间的相关系数|ρn|,得到相关系数矩阵hk=[|ρ1|,…,|ρn|,…,|ρZ-1|;
步骤C2、对相关系数矩阵hk降序排序;
步骤C3、设定阈值ratio1,对降序后的相关系数矩阵hk,搜索视觉短语,若|ρn|<ratio1,则将该视觉短语加入新建的视觉短语集合Bg={b1,b2,…,bk,…,bM}中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910586981.5/1.html,转载请声明来源钻瓜专利网。