[发明专利]一种基于逆向词袋模型的图像识别方法在审
申请号: | 202010292713.5 | 申请日: | 2020-04-13 |
公开(公告)号: | CN111523554A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 裴云强;吴亚东;王赋攀;侯志伟 | 申请(专利权)人: | 四川轻化工大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 643000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逆向 模型 图像 识别 方法 | ||
1.一种基于逆向词袋模型的图像识别方法,其特征在于:包括以下步骤:
步骤1、逆向词袋模型生成:在服务器端提取所有参考图像的SURF特征点并获得相应64维描述子,利用K-means建立逆向词袋模型,叶子节点对应“视觉单词”;
步骤2、目标图像传输:打开Web摄像头捕获图像,将该图像直接上传到服务器,提取图像的SURF特征点,并获得相应的描述子;
步骤3、图像词向量生成:利用已建立的逆向词袋模型对参考和目标图像的所有SURF描述子进行分类,并将每个描述子的分类结果关联到视觉单词上,随后计算出相应词向量;
步骤4、目标图像识别:计算目标图像词向量和参考图像词向量的欧氏距离,将距离最小值对应的参考图像作为识别结果。
2.根据权利要求1所述的基于逆向词袋模型的图像识别方法,其特征在于:所述步骤1和步骤2中描述子的获得方法是:先获取参考或目标图像,分别对每张图像进行扩展以建立一个基于盒子滤波器的图像金字塔,然后对图像的各个尺度使用SURF算法提取所有SURF特征点,并对每一个SURF特征点生成相应的描述子。
3.根据权利要求1或2所述的基于逆向词袋模型的图像识别方法,其特征在于:所述步骤1中,所述逆向词袋模型的数据库建立方法包括以下步骤:
步骤1.1、定义一个N叉树结构,其层数为K,每层节点数为Ni,i表示第i层;
步骤1.2、根据该产品应用的领域以及所分析的数据库规模大小,确定最后一层叶子节点数;
步骤1.3、对数据库图像所有描述子基于K-means算法做聚合分类,得到N个子节点的分类结果,并将每个节点内所有描述子的簇类中心作为该节点的描述子,各个节点根据其自身所在位置编号排序;
步骤1.4、将该层排在第一位的节点的描述子与当前层剩下的N-1个节点的描述子计算欧氏距离,找到距离最小的节点并将该节点与当前第二个位置的节点交换位置;不考虑已配对的节点,对剩下的奇数位置的节点依次进行上述操作直到遍历完该层,接着对该层所有配对的两个节点求得其平均描述子作为其父节点的描述子;
步骤1.5、进入第K-1层,重复步骤1.4,直到进入第二层,生成图像数据库的N叉树结构模型;
步骤1.6、从第二层开始向下对该树进行维护,除第二层外,每层每个节点的位置调整到根据欧氏距离配对前所在的位置,直到叶子节点归位正确,每个叶子节点对应独立的“视觉单词”,完成N叉树的维护,生成逆向词袋模型;
步骤1.7、将逆向词袋模型存储到服务器端数据库中,建立N叉树结构的图像数据库。
4.根据权利要求1或2所述的基于逆向词袋模型的图像识别方法,其特征在于:所述步骤3中,所述参考图像词向量的生成包括以下步骤:
步骤3.1.1、给参考图像一个唯一的编号;
步骤3.1.2、利用已建立的逆向词袋模型对参考图像的所有SURF描述子进行分类,待该参考图像的所有描述子都分配到相应的叶子节点上后,根据词频,利用TF-IDF计算出与之对应参考图像的词向量,并将该词向量以及对应参考图像的编号存入服务器端数据库;
步骤3.1.3、对每一张参考图像进行步骤3.1.1-3.1.2,得到每张参考图像的词向量并存入服务器端数据库。
5.根据权利要求1或2所述的基于逆向词袋模型的图像识别方法,其特征在于:所述步骤3中,所述目标图像词向量的生成包括以下步骤:
步骤3.2.1、打开Web摄像头由用户捕获图像,将该图像直接上传到服务器,提取目标图像的SURF特征点,并获得相应的描述子;
步骤3.2.2、利用已建立的逆向词袋模型对目标图像的所有SURF描述子进行分类,并将每个描述子的分类结果关联到视觉单词上,随后计算出相应目标图像的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川轻化工大学,未经四川轻化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010292713.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手扶式婴幼儿学步训练装置
- 下一篇:一种基于数据库的文档搜索方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序