[发明专利]一种文本识别方法、存储介质及设备在审

申请号：	202110267493.5	申请日：	2021-03-12
公开（公告）号：	CN115082938A	公开（公告）日：	2022-09-20
发明（设计）人：	林建民	申请（专利权）人：	广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司
主分类号：	G06V30/41	分类号：	G06V30/41;G06V30/14;G06V30/18;G06V30/19
代理公司：	北京恒博知识产权代理有限公司 11528	代理人：	张晓芳
地址：	510530 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法存储介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种文本识别方法、存储介质及设备，其中方法包括：在文本图像中提取至少两个文本行图像；基于指定宽度值，并采用拼接方式对所述至少两个文本行图像进行拼接处理，以获得第一拼接图像集合；基于空白像素对所述第一拼接图像集合中各第一拼接图像进行填充处理，以获得第二拼接图像集合，所述第二拼接图像集合中各第二拼接图像的宽度值满足所述指定宽度值；对所述各第二拼接图像进行并行文本识别，以获得初始文本识别结果；其中，所述拼接方式用于使得填充处理的空白像素最少。采用本申请，可以减少填充的空白像素产生的冗余，进而减少识别空白像素所耗费的资源和时间，提升对文本图像进行文本识别的效率。

技术领域

本申请涉及计算机技术领域，尤其涉及一种文本识别方法、存储介质及设备。

背景技术

随着计算机技术的不断发展和普及，在日常生活中采用手机、电脑等终端中的安装的终端应用对文本图像中的文本内容进行识别的情况已经非常普遍。在对文本图像进行文本识别的过程中，由于文本图像中的很多文本行的行宽度值较小，包含文本内容较少，因此在进行文本识别过程时，往往需要对不饱和的文本行内容进行较多的空白像素的识别，大大降低了对文本图像进行文本识别的效率。

发明内容

本申请提供一种文本识别方法、存储介质及设备，可以减少填充的空白像素产生的冗余，进而减少识别空白像素所耗费的资源和时间，提升对文本图像进行文本识别的效率。

第一方面，本申请实施例提供一种文本识别方法，该方法包括：

在文本图像中提取至少两个文本行图像；

基于指定宽度值，并采用拼接方式对所述至少两个文本行图像进行拼接处理，以获得第一拼接图像集合；

基于空白像素对所述第一拼接图像集合中各第一拼接图像进行填充处理，以获得第二拼接图像集合，所述第二拼接图像集合中各第二拼接图像的宽度值满足所述指定宽度值；

对所述各第二拼接图像进行文本识别，以获得初始文本识别结果；

其中，所述拼接方式用于使得填充处理的空白像素最少。

第二方面，本申请实施例提供一种文本识别设备，包括：

提取单元，用于在文本图像中提取至少两个文本行图像；

拼接单元，用于基于指定宽度值，并采用拼接方式对所述至少两个文本行图像进行拼接处理，以获得第一拼接图像集合；

填充单元，基于空白像素对所述第一拼接图像集合中各第一拼接图像进行填充处理，以获得第二拼接图像集合，所述第二拼接图像集合中各第二拼接图像的宽度值满足所述指定宽度值；

识别单元，用于对所述各第二拼接图像进行并行文本识别，以获得初始文本识别结果；

其中，所述拼接方式用于使得填充处理的空白像素最少。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法的步骤。

第四方面，本申请实施例提供一种计算机设备，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法的步骤。

在本申请实施例中，通过采用拼接方式对文本图像中提取的文本行图像进行拼接处理，以获得第一拼接图像集合，并基于空白像素对第一拼接图像集合中各第一拼接图像进行填充处理，以进行并行识别。由于采用了最少空白像素的拼接方式对文本图像中的文本行图像进行拼接，可以最大限度地减少填充的空白像素产生的冗余，进而减少了识别空白像素所耗费的资源和时间，提升了对文本图像进行文本识别的效率。

附图说明

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司，未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110267493.5/2.html，转载请声明来源钻瓜专利网。

上一篇：一种彩色Eink平板电脑
下一篇：一种集成化硅基宽光谱单光子雪崩二极管及制作方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文本识别方法、存储介质及设备在审

专利文献下载