[发明专利]一种基于图像处理的字体识别方法在审
申请号: | 201811035104.0 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109409373A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 龙华;吴睿;熊新;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字体识别 字体 图像处理 字符文字 字符特征向量 二值化处理 向量数据库 单个字符 人机交互 输出识别 数据计算 特征向量 图像形式 用户上传 字符特征 字符形状 字体特征 字体文件 后提取 灰度化 排序 切割 数据库 集合 图像 计算机 灵活 组建 | ||
本发明涉及一种基于图像处理的字体识别方法,属于字体识别技术领域。本发明通过收集TTC字体文件,从中提取字符特征向量以组建字体特征向量数据库,由用户上传单个字符的图像形式信息及对应的字符文字信息,利用现代切割技术及字符形状特征,对图像进行特定的灰度化、二值化处理后提取字符特征并生成特征向量,与数据库中所有字符为用户输入的字符文字信息的数据计算其字体识别度,最后通过排序输出识别度最高的字体集合。本发明与现有技术相比,主要解决了现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象,增加了目前依靠计算机对字体进行识别的准确性与灵活性。
技术领域
本发明涉及一种基于图像处理的字体识别方法,属于字体识别技术领域。
背景技术
字体是工作中极为常用的东西,无论使用何种文档编辑器,字体是一定要用的东西。字体就是“到用时,方恨少”,在日常生活中,浏览各类网站时往往都会遇到很多有意思的字体,但因为不知道其为何种字体,便与之交错。
目前,互联网上已经有一些识别字体的网站供人们使用,其流程通常先由用户上传所要识别的字符图像,并指出该字符图像所对应的字符信息,接着通过内定的识别算法对其识别并输出,但其中的准确度并不理想。简单地说,就是其中所使用的字体识别算法的准确度不高。
发明内容
本发明要解决的技术问题是针对现有技术的局限和不足,提供一种基于图像处理的字体识别方法,以解决现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象,致力于增加目前依靠计算机对字体进行识别的准确性与灵活性。
本发明的技术方案是:一种基于图像处理的字体识别方法,具体包括以下步骤:
Step0.1:收集TTC字体文件,其TTC字体文件包括但不限于宋体、黑体、微软雅黑等现有90%以上的字体,记TTC字体文件数量为K;
Step0.2:从TTC字体文件中提取出每个字符所对应的图像,即字符图像大小为l×w(单位为像素点),共计N个像素点;将字符图像作为输入源,生成该字符所对应的字符矩阵Il×w,该矩阵中的元素值即为该像素点的灰度值;定义ξ为灰度二值化阈值,对矩阵Il×w进行公式(1)所示二值化处理,之后将矩阵Il×w按照从左至右、从上至下的规则生成该字符所对应的特征向量{f1,f2,…,fN};将所有字符、字符特征向量、以及所对应的字体信息等存入数据库,组建字体特征向量数据库;
Step1:由用户上传单个字符的图像形式信息X,并指出该字符所对应的字符文字信息X′;
Step2:利用现代切割技术及字符形状特征,将图像X以l:w的比例剪切至待测字符X′尽可能铺满图像为止,但要将其字符重心处于图像的中心,并留取合适的边距,生成待测字符X′的修整图像
Step3:将待测字符X′的修整图像按比例压缩至l×w像素点,共计N个像素点,随后生成待测字符X′的修整图像所对应的字符矩阵Xl×w,该矩阵中的元素值即为该像素点的灰度值;依然以ξ为灰度二值化阈值,对矩阵Xl×w进行公式(2)所示二值化处理,之后将矩阵Xl×w按照从左至右、从上至下的规则生成待测字符X′所对应的特征向量{x1,x2,…,xN};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811035104.0/2.html,转载请声明来源钻瓜专利网。