[发明专利]在图像中检测文本的方法、装置、介质及电子设备有效

专利信息
申请号: 201810213160.2 申请日: 2018-03-15
公开(公告)号: CN108446698B 公开(公告)日: 2020-08-21
发明(设计)人: 李玉梅;杨学行 申请(专利权)人: 腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/20;G06T5/50;G06T7/536
代理公司: 深圳市隆天联鼎知识产权代理有限公司 44232 代理人: 刘抗美
地址: 100086 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 检测 文本 方法 装置 介质 电子设备
【说明书】:

发明的实施例提供了一种在图像中检测文本的方法、装置、介质及电子设备。该检测文本的方法包括:获取待处理图像;对所述待处理图像进行透视变换处理,以将所述待处理图像调整为正视图,得到处理后的校正图像;基于所述校正图像进行文本检测。本发明实施例的技术方案能够通过对待处理图像进行调整得到正视图,进而能够在得到的正视图的基础上进行文本检测,提高了文本检测的准确率,避免了由于图像变形而导致文本检测困难、准确率较低的问题。

技术领域

本发明涉及计算机技术领域,具体而言,涉及一种在图像中检测文本的方法、装置、介质及电子设备。

背景技术

自然场景图像是由各种拍摄设备(如照相机、具有拍摄功能的手机等)在没有特定限制的条件下,直接对生活中真实存在的场景拍摄的图像。自然场景图像中的文本可提供丰富的语义信息,例如,自然场景图像中标识街道、车牌、菜单等的文本信息,能够辅助人们方便地理解场景,因此在自然场景图像中准确检测出文本是很有必要的。

但是,由于自然场景图像的复杂性,造成自然场景图像中的文本识别困难,并且识别的准确率也较低,因此如何能够有效检测自然场景图像中的文本,以提高文本检测的准确率成为亟待解决的技术问题。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术。

发明内容

本发明实施例的目的在于提供一种在图像中检测文本的方法、装置、介质及电子设备,进而至少在一定程度上克服目前对图像中的文本识别困难及检测准确率较低的问题。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明实施例的一个方面,提供了一种在图像中检测文本的方法,包括:获取待处理图像;对所述待处理图像进行透视变换处理,以将所述待处理图像调整为正视图,得到处理后的校正图像;基于所述校正图像进行文本检测。

根据本发明实施例的一个方面,提供了一种在图像中检测文本的装置,包括:图像获取单元,用于获取待处理图像;第一处理单元,用于对所述待处理图像进行透视变换处理,以将所述待处理图像调整为正视图,得到处理后的校正图像;第二处理单元,用于基于所述校正图像进行文本检测。

在本发明的一些实施例中,基于前述方案,所述第一处理单元包括:矩阵构建单元,用于构建透视变换矩阵;透视变换单元,用于根据所述透视变换矩阵,对所述待处理图像进行透视变换处理。

在本发明的一些实施例中,基于前述方案,所述矩阵构建单元包括:直线段检测单元,用于检测所述待处理图像中的直线段;直线段选取单元,用于从检测到的直线段中选取出符合条件的目标直线段;四边形确定单元,用于确定所述目标直线段所在的直线能够组成的面积最大的四边形;第一生成单元,用于生成所述四边形对应的矩形框;构建单元,用于根据所述四边形的各个顶点与所述矩形框的各个顶点的对应关系,构建所述透视变换矩阵。

在本发明的一些实施例中,基于前述方案,所述直线段检测单元包括:合并单元,用于确定所述待处理图像中的各个像素点与水平线的夹角,并合并所述夹角的差值在预定范围内的像素点,得到至少一个区域;第二生成单元,用于生成各个所述区域的最小外接矩形;像素点选取单元,用于针对各个所述区域,选取所述夹角与所述最小外接矩形的主方向的角度差小于或等于预定值的目标像素点;直线段确定单元,用于根据各个所述区域的最小外接矩形内的像素点个数和所述目标像素点的个数,确定各个所述区域是否为直线段。

在本发明的一些实施例中,基于前述方案,所述直线段选取单元用于:从检测到的直线段中过滤掉长度小于或等于预定长度的直线段,和/或过滤掉与竖直方向和/或水平方向的夹角大于或等于预定角度的直线段,以得到所述目标直线段。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司,未经腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810213160.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top