[发明专利]一种基于网格多级精确度递进式比划识别方法有效
申请号: | 201410822919.9 | 申请日: | 2014-12-22 |
公开(公告)号: | CN104537343B | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 纪庆革;王新文;严聪;印鉴 | 申请(专利权)人: | 中山大学;广州智海纵横信息科技有限公司;广州中大南沙科技创新产业园有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/68 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510260 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网格 多级 精确度 递进 比划 识别 方法 | ||
本发明提供了一种基于网格多级精确度递进式比划识别方法,该方法采集若干个不同的比划并分别对其依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理,对处理后的比划进行若干级精确度下拓扑特征向量的提取,最后将原始采集的比划和其特征向量作为一个比划模板存入模板库;用户输入比划A,对比划A依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理得到比划A*,对比划A*进行若干级精确度下拓扑特征向量的提取;计算模板库中与提取出的比划A的拓扑特征向量差距最小的比划模板,并将其作为输出识别结果。
技术领域
本发明涉及比划识别、草图检索领域,具体涉及到一种基于网格多级精确度递进式比划识别方法。
背景技术
基于关键字或基于自然语言的信息检索技术是现有的常用技术,输入文本可以检索到兴趣数据(如文本、图片或声音等)这极大地提高了人们搜集信息的能力。一些更为精确与直观的检索需求逐渐浮出了水面且近些年也引起了学界较大的关注,常见的如基于语意的多媒体信息检索(图片、视频或声音等),更为直观的是基于内容的信息检索即CBIR(Content-based image retrieval),简单来讲可以认为是以图搜图——即图片本身替代了关键字,搜索的目标是与原图相同或相近的图片。
若想要搜索一幅与现有图片相近的图片,又或者是已知一幅图片的部分但想搜索到整幅图片,此时就无法很好地判别需要的关键字,这种情况需要的就是CBIR技术。CBIR技术从检索结果上看可以分为两类:一类是检索与原图基本一致或部分区域基本一致的图片;一类是检索与原图部分特征(如颜色分布、纹理、轮廓等)相近的图片;后者的更直接的应用为草图检索,即手绘简单的草图作为检索内容。
草图通常通过手绘的方式得到,手绘图形也常被称为“比划”。比划的识别是草图检索的核心部分,而草图的最重要的是特征提取与匹配。而特征值的提取和匹配一直是草图检索领域的难点和关键点,其直接决定了检索的整体性能,同时决定了其能满足的应用。草图检索的实际应用如大型搜索引擎中通过web页面手绘输入图片进行检索,也如近几年兴起的儿童画板类应用:以儿童随手绘制出脑海里的画面作为输入,系统根据其提供出大量相近的但颜色纹理细节更为生动复杂的候选,之后儿童选取系统提供的这些更适合用于绘画局部元素来拼接出画面。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提出一种直观、高效率且对起点及比划顺序无依赖的基于网格多级精确度递进式比划识别方法,。
为了达到上述技术效果,本发明的技术方案如下:
一种基于网格多级精确度递进式比划识别方法,包括以下步骤:
S1:建立比划模板库:采集若干个不同的比划并分别对其依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理,分别在若干级精确度下对处理后的比划进行拓扑特征向量的提取,最后将原始采集的比划和其特征向量作为一个比划模板来建立比划模板库,其中采集的比划经缩放规范化后被一标准包围框所包围,将该标准包围框分割为若干子网格,标准包围框被分割为不同的子网格数即表示该识别方法的不同级别的精确度,子网格数越多该方法的精确度级别越高;
S2:提取待识别的比划特征向量:对用户输入的比划A依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理得到比划A*,对比划A*进行若干级精确度下拓扑特征向量的提取;
S3:计算得到模板库中与提取出的比划A的拓扑特征向量差距最小的比划模板,并将其作为输出识别结果。
本发明中,对于待识别比划或是待采集的模板比划,其第一步均为规范化。规范化的目的在于消除因人为绘制习惯而引入的干扰,同时做到旋转、缩放无关性。对于需要采集入库作为模板的比划,过程是先规范化,之后提取出其由多级精确度下拓扑特征组成的特征向量,后将比划和其特征向量作为一个比划模板采集入模板库。而对于待识别比划,也即先规范化,然后提取出其由多级精确度下拓扑特征组成的特征向量,然后与模板库中各模板的特征向量进行比较得出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州智海纵横信息科技有限公司;广州中大南沙科技创新产业园有限公司,未经中山大学;广州智海纵横信息科技有限公司;广州中大南沙科技创新产业园有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410822919.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多方位人脸识别装置
- 下一篇:一种改善在非理想环境下虹膜识别性能的方法