[发明专利]图片文字的识别方法及装置有效
申请号: | 201611060177.6 | 申请日: | 2016-11-25 |
公开(公告)号: | CN106599940B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 李东鸽;牟晓光 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06F16/903 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘喆;刘铁生 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文字 识别 方法 装置 | ||
本发明公开了一种图片文字的识别方法及装置,涉及图像处理技术领域,主要目的在于解决在识别图片中的文字过程中,在将其与文字库中预先存储的文字进行比对时,为确保比对结果的正确性,文字库中的文字同样为标准排版,导致文字库中的数据量较大,使得现有技术中的比对方式计算量大,文字识别时间较长、性能较低的问题,本发明的技术方案包括:将图片中的文字拆分为多个矩形文字框,其中,矩形文字框的个数与图片中文字的个数一致;将所述矩形文字框内的文字编码为待匹配字符串,并将所述待匹配字符串与预设文字库中的字符串进行匹配;根据匹配结果识别所述待匹配字符串对应的文字。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图片文字的识别方法及装置。
背景技术
伴随着互联网技术的快速发展,在网页中展示信息的形式也越来越多,越多越丰富。例如,网页中为了吸引更多的访客可以通过图片的形式进行内容的展示,在通过图片展示网页内容时,可将展示的内容置于图片中,以增强展示效果的趣味性。
目前,在使用图片展示网页内容时,一些恶意用户可能会将一些非法广告、敏感词汇、污秽谩骂诅咒词汇等恶意信息放置于图片中进行展示,给网络环境带去一定的不良影响。为了营造一个良好的网络环境,需对上述类型的图片进行过滤、屏蔽,现有技术中,通过识别图片中文字的方式避免恶意图片的展示;在识别图片中的文字时,将整个图片切分成多个小块图片,确定每个小块图片的色差,依次将小块图片的色差与文字库中预先存储的文字对应的色差进行相似度的匹配,色差相似度越高,说明文字的相似度越高,从而实现图片文字的识别。
发明人在实现上述过程时发现,现有技术中由于图片中的文字为标准排版的文字,在将其与文字库中预先存储的文字进行比对时,为确保比对结果的正确性,文字库中的文字同样为标准排版,导致文字库中的数据量较大,使得现有技术中的比对方式计算量大,文字识别时间较长、性能较低。
发明内容
有鉴于此,本发明提供的一种图片文字的识别方法及装置,主要目的在于解决现有技术中在识别图片中的文字过程中,在将其与文字库中预先存储的文字进行比对时,为确保比对结果的正确性,文字库中的文字同样为标准排版,导致文字库中的数据量较大,使得现有技术中的比对方式计算量大,文字识别时间较长、性能较低的问题。
依据本发明一个方面,本发明提供了一种图片文字的识别方法,包括:
将图片中的文字拆分为多个矩形文字框,其中,矩形文字框的个数与图片中文字的个数一致;
将所述矩形文字框内的文字编码为待匹配字符串,并将所述待匹配字符串与预设文字库中的字符串进行匹配;
根据匹配结果识别所述待匹配字符串对应的文字。
可选的,将图片中的文字拆分为多个矩形文字框包括:
对所述图片中的文字进行解析,确定图片中文字的识别起始点;
从所述识别起始点确认各个文字的字高度及字宽度;
根据所述字高度及字宽度将图片中的文字进行拆分。
可选的,将所述矩形文字框内的文字编码为待匹配字符串包括:
获取所述矩形文字框内的文字像素及空白像素,并分别对所述文字像素及空白像素进行二进制编码;其中,所述文字像素使用二进制中的1表示,所述空白像素使用二进制中的0标识;
将二进制编码后的文字像素及空白像素转换为十六进制,得到所述待匹配字符串。
可选的,在分别对所述文字像素及空白像素进行二进制编码之前,所述方法包括:
计算所述矩形文字框内文字像素及空白像素的第一像素总数;
获取所述预设文字库中一个字包含的第二像素总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611060177.6/2.html,转载请声明来源钻瓜专利网。