[发明专利]精确定位图像中字符的方法、装置及系统有效
申请号: | 201710258835.0 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107203766B | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 朱钱虎 | 申请(专利权)人: | 杭州泽火科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 310053 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布概率 字符区域 仿射变换矩阵 装置及系统 定位图像 直方图统计 图像 迭代更新 定位结果 定位效果 矩阵迭代 区域定位 终止条件 字符位置 初始化 低成本 光流法 模组端 直方图 更新 像素 重复 应用 | ||
1.一种精确定位图像中字符的方法,其特征在于,包括:
步骤S1,初始化仿射变换矩阵和字符区域分布概率;
步骤S2,根据所述字符区域分布概率对图像的像素值进行直方图统计;具体包括:
根据所述字符区域分布概率,对字符区域内的像素值进行直方图统计得到第一直方图,对字符区域外的像素值进行直方图统计得到第二直方图;
步骤S3,根据直方图统计结果和所述字符区域分布概率迭代更新仿射变换矩阵;
步骤S4,根据更新后的仿射变换矩阵更新字符区域分布概率;
步骤S5,重复步骤S2-步骤S4,直到满足第一终止条件;
步骤S6,根据最终确定的字符区域分布概率得到所述图像中的字符位置;
所述根据直方图统计结果和所述字符区域分布概率迭代更新仿射变换矩阵,包括:
步骤S31,将所述图像通过所述仿射变换矩阵变换为新的图像I2;
步骤S32,初始化Psum,P2sum为3x3的0矩阵;
步骤S33,对于I2中的每一个像素x,根据所述第一直方图、所述第二直方图和所述字符区域分布概率迭代更新仿射变换矩阵计算Psum和P2sum;
步骤S34,计算Psum的逆矩阵iPsum;
步骤S35,根据iPsum和P2sum计算仿射变换矩阵的增量;
步骤S36,根据仿射变换矩阵的增量更新仿射变换矩阵;
步骤S37,循环步骤S31-步骤S36,直到满足第二终止条件,得到迭代更新后的仿射变换矩阵。
2.根据权利要求1所述的方法,其特征在于,所述初始化仿射变换矩阵和字符区域分布概率,包括:
根据字符区域初始化仿射变换矩阵,其中,所述字符区域是基于统计图像中常见的字符区域得到的;
创建于图像大小相同的一个浮点矩阵,所述浮点矩阵用于存储字符区域分布概率;
对图像中的所有像素逐个进行位置判断,包括:若像素的坐标落入所述字符区域内,则根据仿射变换矩阵变换图像中像素的坐标,将变换后的坐标对应的字符区域分布概率设为大于零的值,若像素的坐标落入所述字符区域外,则根据仿射变换矩阵变换图像中像素的坐标,将变换后的坐标对应的字符区域分布概率设为小于零的值;
完成所有像素的位置判断,得到初始化的字符区域分布概率。
3.根据权利要求1所述的方法,其特征在于,所述步骤S31中仅对字符外框内的图像进行仿射变换。
4.根据权利要求1所述的方法,其特征在于,所述将所述图像通过所述仿射变换矩阵变换为新的图像I2,包括:
对于I2中每隔一个或多个像素进行如下操作:根据第一直方图、第二直方图和字符区域分布概率迭代更新仿射变换矩阵计算Psum和P2sum。
5.根据权利要求1所述的方法,其特征在于,所述根据更新后的仿射变换矩阵更新字符区域分布概率,包括:
对图像中的所有像素逐个进行位置判断,包括:若像素的坐标落入所述字符区域内,则根据更新后的仿射变换矩阵变换图像中像素的坐标,将变换后的坐标对应的字符区域分布概率设为大于零的值,若像素的坐标落入所述字符区域外,则根据更新后的仿射变换矩阵变换图像中像素的坐标,将变换后的坐标对应的字符区域分布概率设为小于零的值;
完成所有像素的位置判断,得到更新后的字符区域分布概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州泽火科技有限公司,未经杭州泽火科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710258835.0/1.html,转载请声明来源钻瓜专利网。