[发明专利]一种基于稀疏表示和判决分析的数码球识别方法无效
申请号: | 201010586753.7 | 申请日: | 2010-12-14 |
公开(公告)号: | CN102034094A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 王东辉;程丽莉;邓霄 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/66 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 表示 判决 分析 数码 识别 方法 | ||
技术领域
本发明属于图像稀疏表示和概率计算领域,具体是涉及一种基于稀疏表示和判决分析的数码球识别方法。
背景技术
传统的字符识别都是在平面上操作的,但如果把这些平面操作的方法用于曲面,就会出现很多问题。但是我们生活中的很多东西并不仅仅是平面上的识别,对于曲面甚至不规则图形上的识别是个很有意义又很实用的方法。数码球是一种在它表面上印有唯一数字的球,因此我们需要一种新的方法来识别球面上的数字信息。我们先实现静止图片的识别,然后对高速运动的数码球进行连续拍摄,再进行识别,这是个很有挑战性也很有工业价值的问题。
由于是球面上操作的,所以先要检测到圆,然后定位数字,接着把数字信息表示出来,最主要的还是识别这个数字信息。然而,因为数码球存在着三维旋转,不同视角等问题,所以导致了不同的观测结果。此外,通过单个相机,我们只能得到数码球的部分信息,不能得到完整的球面信息用于识别。最后,当图片中存在多个数码球的时候,我们如何准确定位和去除那些错误定位的圆很重要。所以我们提出了用稀疏表达和多次概率分布的测量来实现球面数字的识别。
近年来,稀疏表达在机器学习和模式识别中应用的越来越多了。尤其对于处理高维数据,稀疏的方法很有效。基于稀疏表达这个技术,每个样本都可以表达为训练数据的稀疏线性组合。当这个优化表示足够稀疏时,基于凸优化的算法能够有效用于解决该问题。比较有名的稀疏表达方法有lasso,弹性网(elastic net)和非负方法(nonnegative garrote)。该发明中,就是用这三种方法来表达数码球的信息用于分类的。
在表示了数码球的信息后,接着就是分类了。一直以来,分类都是机器学习中的重点,分类的方法也是多种多样的。在机器学习提出来之前,主要的分类方法是相关。随着机器学习的广泛兴起,有越来越多的分类方法了,如PCA(Shlens Jonathon,A Tutorial on Principal Component Analysis.Systems Neurobiology Laboratory,Salk Insitute for Biological Studies,2009),Fisher判决(Fisher,Ronald A.,The use of multiple measurements intaxonomic problems.Annals Eugen.,1936.),线性判别分析(LDA)(R.Duda,P.Hart,and D.Stork,Pattern classification,2rd ed.Wiley-Interscience,2000)。本发明利用多次测量和概率方法来进行分类,通过单次甚至多次的后验判决方法达到不错的数码球识别率。
发明内容
本发明提供了一种基于稀疏表示和判决分析的数码球识别方法,该方法识别能力强,识别效果好。
一种基于稀疏表示和判决分析的数码球识别方法,包括:
(1)把数码球集合中的每一个数码球单独放置在单色背景下,利用单摄像头连续采集单幅或多幅图像,自动定位每幅图像中的数码球并提取视觉特征,并对所有的视觉特征建立稀疏表达,形成训练样本特征集合;
(2)把待识别的一个或多个数码球放置在同样的场景中,采集单幅或多幅图像,对每幅图像中的所有数码球自动定位并提取子图像;对单幅或者多幅图像中对应同一数码球的子图像提取视觉特征,并利用训练样本特征集合建立该子图像的稀疏表达;
(3)采用判决分析方法进行识别,得到测试图像所属的类别,其中对于多幅图像的情况,采用联合后验判决的方法实现。
所述的步骤(1)中形成训练样本特征集合的方法为在单色背景下用单摄像头连续采集单幅或多幅图像,每幅图中只有一个数码球,形成训练样本集合,定位图像中的球并提取视觉特征,建立训练样本集合的稀疏表达:把数码球集合中的每一个数码球,单独放置在单色背景(如黑色)下,利用单摄像头连续采集单幅或多幅图像作为训练样本集合,每次获得的图像都是单视角的,具体步骤如下:
(a)对采集的图像做预处理,使用Canny算子进行边缘检测,得到二值化图像,接着给出圆的大致半径,使用霍夫变换或外接圆构造匹配的方法定位每幅图中的数码球位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010586753.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大覆盖面远投式救生圈
- 下一篇:辅助轮结构