[发明专利]一种基于图像处理的字体识别方法在审

申请号：	201811035104.0	申请日：	2018-09-06
公开（公告）号：	CN109409373A	公开（公告）日：	2019-03-01
发明（设计）人：	龙华;吴睿;熊新;邵玉斌;杜庆治	申请（专利权）人：	昆明理工大学
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/46
代理公司：	暂无信息	代理人：	暂无信息
地址：	650093 云***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字体识别字体图像处理字符文字字符特征向量二值化处理向量数据库单个字符人机交互输出识别数据计算特征向量图像形式用户上传字符特征字符形状字体特征字体文件后提取灰度化排序切割数据库集合图像计算机灵活组建
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于图像处理的字体识别方法，属于字体识别技术领域。本发明通过收集TTC字体文件，从中提取字符特征向量以组建字体特征向量数据库，由用户上传单个字符的图像形式信息及对应的字符文字信息，利用现代切割技术及字符形状特征，对图像进行特定的灰度化、二值化处理后提取字符特征并生成特征向量，与数据库中所有字符为用户输入的字符文字信息的数据计算其字体识别度，最后通过排序输出识别度最高的字体集合。本发明与现有技术相比，主要解决了现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象，增加了目前依靠计算机对字体进行识别的准确性与灵活性。

技术领域

本发明涉及一种基于图像处理的字体识别方法，属于字体识别技术领域。

背景技术

字体是工作中极为常用的东西，无论使用何种文档编辑器，字体是一定要用的东西。字体就是“到用时，方恨少”，在日常生活中，浏览各类网站时往往都会遇到很多有意思的字体，但因为不知道其为何种字体，便与之交错。

目前，互联网上已经有一些识别字体的网站供人们使用，其流程通常先由用户上传所要识别的字符图像，并指出该字符图像所对应的字符信息，接着通过内定的识别算法对其识别并输出，但其中的准确度并不理想。简单地说，就是其中所使用的字体识别算法的准确度不高。

发明内容

本发明要解决的技术问题是针对现有技术的局限和不足，提供一种基于图像处理的字体识别方法，以解决现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象，致力于增加目前依靠计算机对字体进行识别的准确性与灵活性。

本发明的技术方案是：一种基于图像处理的字体识别方法，具体包括以下步骤：

Step0.1：收集TTC字体文件，其TTC字体文件包括但不限于宋体、黑体、微软雅黑等现有90％以上的字体，记TTC字体文件数量为K；

Step0.2：从TTC字体文件中提取出每个字符所对应的图像，即字符图像大小为l×w(单位为像素点)，共计N个像素点；将字符图像作为输入源，生成该字符所对应的字符矩阵I_l×w，该矩阵中的元素值即为该像素点的灰度值；定义ξ为灰度二值化阈值，对矩阵I_l×w进行公式(1)所示二值化处理，之后将矩阵I_l×w按照从左至右、从上至下的规则生成该字符所对应的特征向量{f₁,f₂,…,f_N}；将所有字符、字符特征向量、以及所对应的字体信息等存入数据库，组建字体特征向量数据库；

Step1：由用户上传单个字符的图像形式信息X，并指出该字符所对应的字符文字信息X′；

Step2：利用现代切割技术及字符形状特征，将图像X以l:w的比例剪切至待测字符X′尽可能铺满图像为止，但要将其字符重心处于图像的中心，并留取合适的边距，生成待测字符X′的修整图像

Step3：将待测字符X′的修整图像按比例压缩至l×w像素点，共计N个像素点，随后生成待测字符X′的修整图像所对应的字符矩阵X_l×w，该矩阵中的元素值即为该像素点的灰度值；依然以ξ为灰度二值化阈值，对矩阵X_l×w进行公式(2)所示二值化处理，之后将矩阵X_l×w按照从左至右、从上至下的规则生成待测字符X′所对应的特征向量{x₁,x₂,…,x_N}；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆明理工大学，未经昆明理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811035104.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种字符分割方法、装置、存储介质及视觉检测系统
下一篇：一种基于联合的同批次试卷答案区域切割方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图像处理的字体识别方法在审

专利文献下载