[发明专利]一种基于字符识别的图像处理方法及装置在审
申请号: | 201810968260.6 | 申请日: | 2018-08-23 |
公开(公告)号: | CN109101969A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 刘振坤;林剑亮 | 申请(专利权)人: | 深圳市深晓科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 广东广和律师事务所 44298 | 代理人: | 陈巍巍 |
地址: | 518000 广东省深圳市南山区招商*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三通道图像 二值图像 灰度图像 滤波图像 透视变换 图像处理 字符识别 二值化 滤波 算法 图像处理技术 摄像头 抗噪能力 输入图像 算法公式 有效图像 字母信息 灰度化 连通域 识别率 灰度 临域 检测 转化 | ||
本发明涉及图像处理技术领域,公开了一种基于字符识别的图像处理方法及装置,该方法包括:通过摄像头获取待识别字符的三通道图像;将所述三通道图像通过灰度算法公式转化为灰度图像;对所述灰度图像进行透视变换和滤波,得到滤波图像;对所述滤波图像进行二值化,得到二值图像;通过八临域算法对所述二值图像进行连通域检测,获得有效图像;通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于字符识别的图像处理方法及装置。
背景技术
随着机器人技术的不断发展,具有各种功能的机器人如雨后春笋般相继诞生,其中,有一种自然拼读儿童教育的小型机器人,该机器人需要实时识别立体式的字母,以此推动一些字母相关游戏的进行,培养儿童学习英语的兴趣。目前字符识别领域主要分为两大类,第一类方法为传统的模板匹配方法,该方法需要的运行资源较少,但是对于噪声较为敏感,识别率偏低;第二类方法为基于神经网络的方法,其中,以LeNet-5作为其中的代表(由Yann LeCun 1994年提出),该方法抗噪能力和识别率都比较理想,但是对于计算能力要求较高,对于小型机器人来说并不能达到实时的要求。除此之外,小型机器人受硬件限制,摄像头采集到的图像视角倾斜严重,并且质量较差,这又会给识别带来更大的挑战。
发明内容
本发明的主要目的在于提出一种基于字符识别的图像处理方法及装置,通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
为实现上述目的,本发明提供的一种基于字符识别的图像处理方法,包括:
通过摄像头获取待识别字符的三通道图像;
将所述三通道图像通过灰度算法公式转化为灰度图像;
对所述灰度图像进行透视变换和滤波,得到滤波图像;
对所述滤波图像进行二值化,得到二值图像;
通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
可选地,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
可选地,所述对所述灰度图像进行透视变换和滤波,得到滤波图像包括:
通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
可选地,所述对所述滤波图像进行二值化,得到二值图像之后还包括:
对所述二值图像进行闭操作,去除图像中的裂缝噪声。
可选地,所述通过八临域算法对所述二值图像进行连通域检测,获得有效图像包括:
从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市深晓科技有限公司,未经深圳市深晓科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810968260.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌识别系统及识别方法
- 下一篇:一种医学单据智能识别方法与智能识别系统