[发明专利]适于购物小票的图片文字识别方法在审
申请号: | 201910020874.6 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109766893A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 薛亮;杨陆 | 申请(专利权)人: | 北京数衍科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/46;G06F16/51 |
代理公司: | 北京市卓华知识产权代理有限公司 11299 | 代理人: | 周瑞艳 |
地址: | 100102 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符图片 图片文字 字符区域 购物 硬件配置要求 特征数据库 简化处理 降低设备 空白像素 文字识别 映射关系 字符查询 背景色 二值化 多行 缩放 图片 数据库 查询 统计 | ||
1.一种适于购物小票的图片文字识别方法,包括下列步骤:
1)对图片进行二值化,统计色值数量,将色值数量最多的颜色做为背景色;
2)对图片按行切分,获得一行或多行;
3)对切分后的每一行沿空白像素纵向切分,得到一个或多个字符区域;
4)将每个字符区域生成一张字符图片,将每个字符图片缩放为一个特定尺寸的图片;
5)提取每个字符图片的字符图片特征;
6)依据字符图片特征进行字符查询,获得相应的字符,字符查询以特征数据库为数据基础,所述特征数据库为体现字符图片特征与相应字符映射关系的数据库;
7)将查询获得的字符顺序排列,形成初步的文字识别结果。
2.如权利要求1所述的方法,其特征在于将每个字符图片缩放为一个为一个32×32像素的小图片。
3.如权利要求2所述的方法,其特征在于所述字符图片特征为字符图片中各像素的值顺序排列成的特征字符串。
4.如权利要求3所述的方法,其特征在于以1为字符图片上的前景色像素的值,以0为字符图片上的背景色像素的值。
5.如权利要求1所述的方法,其特征在于所述特征数据库的字段包括dna、width、height和words,其中dna的字段值为字符图片特征,width和height的字段值分别为字符图片的宽和高,words的字段值为所映射的字符。
6.如权利要求5所述的方法,其特征在于构建特征数据库的特征索引,所述特征索引包括完全匹配索引和相似性索引。
7.如权利要求6所述的方法,其特征在于在进行字符查询时,先采用完全匹配索引查询,获得完全匹配的字符,在没有完全匹配的字符的情况下,再采用相似性索引查询,获得相似度最大的字符。
8.如权利要求7所述的方法,其特征在于所述完全匹配索引为针对每个元组,计算dna的hash值hash(dna),将hash(dna)转为36进制数的字符串,再拼接width和height,以由此获得的字值符hash(dna)_width_height作为键,以words作为值,得到一个全量特征数据集,所述相似性索引为先将dna进行分词再构建特征索引。
9.如权利要求1-8所述的方法,其特征在于检测初步的文字识别结果中是否存在同一左右构文字的横向排列字符相互分离的情形,当存在同一左右构文字的横向排列字符相互分离的情形时,将构成同一左右构文字的横向排列字符合并,替换为相应的文字,由此形成最终的文字识别结果,当不存在同一左右构文字的横向排列字符相互分离的情形时,以初步的文字识别结果作为最终的文字识别结果。
10.如权利要求9所述的方法,其特征在于依据字符合并字典进行横向排列字符相互分离的左右构文字的横向排列字符合并,所述字符合并字典为体现左右构文字的左、右字符与该文字的映射关系的字典或数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数衍科技有限公司,未经北京数衍科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910020874.6/1.html,转载请声明来源钻瓜专利网。