[发明专利]一种印刷体字符图像样本的自动生成方法无效
申请号: | 201110096820.1 | 申请日: | 2011-04-18 |
公开(公告)号: | CN102184383A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 夏勇;王宽全;左旺孟;黎捷 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/38 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 韩末洙 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种印刷体字符图像样本的自动生成方法,它涉及字符图像样本的自动生成方法。本发明解决了现有的字符采集方法分割精度低,需人工校验,从而造成样本采集速度慢的技术问题。本发明:将印刷体字符处理成样本字符,设计带有定位区的文档模板,将样本字符输到文档模板的字符区,转换为PDF格式后打印纸质文档,再扫描或照相后,得到实际图像;将PDF格式文档变换为图像,得到理想图像;再从PDF格式文档中抽取字符的位置信息,得到理想图像的字符基准;将理想图像与实际图像配准,建立两幅图像的映射关系,根据射影变换模型将理想图像的字符位置信息映射到实际图像中,将字符图像提取出来,编码保存。本发明适于任何语种的印刷体字符图像。 | ||
搜索关键词: | 一种 印刷体 字符 图像 样本 自动 生成 方法 | ||
【主权项】:
1.一种印刷体字符图像样本的自动生成方法,其特征在于印刷体字符图像样本的自动生成方法按以下步骤进行:步骤一:将印刷体字符输入到一个文本文件index.txt中,相邻两个字符之间插入一个空格,得到样本字符;步骤二:在字符编辑软件中设计一个文档模板,并把文档模板区域内距四周边缘1cm~1.5cm的位置设置“矩形框状”定位区(1),定位区(1)的框的宽度为0.9cm~1.2cm,在定位区(1)内散布放置n个字号为m个points的定位块‘●’(2),其中n至少为4个,m的范围为12points~28points,再在定位区1所包围的区域的上部划出来字符区(3),在定位区(1)所包围的区域的下部划出来标题区(4),其中字符区(3)和标题区(4)相距0.5cm~1.0cm,字符区(3)与定位区(1)相距0.5cm~1.0cm,标题区(4)与定位区(1)相距0.5cm~1.0cm,将步骤一所述的样本字符输入到字符区(3),将标明样本字符内容特性的标识输入到标题区(4),得到文档D1;步骤三:将文档D1转换为PDF格式的文档D2;步骤四:将D2打印成纸质文档,用扫描仪扫描或照相机照相,得到图像格式的文档D3,其中扫描时采用的分辨率为g个dpi;步骤五:从步骤三所述的文档D2中提取每个字符的外接矩形框的四个角点的位置坐标信息作为字符的坐标位置信息,从文档D2中提取每个定位块‘●’(2)的外接矩形框的四个角点的位置坐标信息作为定位块‘●’(2)的坐标位置信息,从文档D2中提取每个字符和定位块‘●’(2)的ASCII码信息,再把字符的坐标位置信息、定位块‘●’(2)的坐标位置信息、字符的ASCII码信息和定位块‘●’(2)的ASCII码信息用XML格式进行保存,得到文档D4;步骤六:将步骤二所述的文档D2转换为图像格式,得到文档D5;步骤七:将步骤四所述的文档D3进行二值化,得到二值化图像D6;步骤八:在步骤七所述的图像D6中检测定位块‘●’(2),提取定位块‘●’的质心q1(x1,y1)、q2(x2,y2)、q3(x3,y3)......qn(xn,yn);步骤九:根据步骤五所述的文档D4计算出定位块‘●’(2)的质心p1(u1,v1)、p2(u2,v2)、p3(u3,v3)......pn(un,vn);步骤十:将质心q1(x1,y1)与p1(u1,v1)对应,q2(x2,y2)与p2(u2,v2)对应、q3(x3,y3)与p3(u3,v3)对应......qn(xn,yn)与pn(un,vn)对应,作为射影变换模型的对应特征点代入到该射影变换模型中,求出射影变换模型的参数a1、b1、c1、a2、b2、c2、a3和b3,得到射影变换模型;其中该射影变换模型为其中i=1、2、3、......、n;步骤十一:根据步骤十所得的射影变换模型,将步骤六所述的文档D5中的所有字符单元位置坐标映射到图像D6中,然后保存为XML标引文档D7;步骤十二:基于标引文档D7,得到文档中所有的字符样本图像,并进行编码与保存,然后建立字符与文件名的索引表,完成印刷体字符图像样本的自动生成过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110096820.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种编码协作软切换方法
- 下一篇:双缸风冷中型超静音汽油发电机组
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序