[发明专利]文本版面分析方法、装置、计算机设备和存储介质有效
申请号: | 202010219551.2 | 申请日: | 2020-03-25 |
公开(公告)号: | CN111340037B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 王晓珂 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 版面 分析 方法 装置 计算机 设备 存储 介质 | ||
一种文本版面分析方法、装置、计算机设备和存储介质,其中,文本版面分析方法包括:获取目标图片;对所述目标图片进行版面区域分割,得到若干个分割区域;根据所述目标图片的纹理特征识别所述目标图片的文字区域;将所述目标图片中的文字区域与所述若干个分割区域进行匹配,以得到各个分割区域包含的文字区域;对每一分割区域包含的文字区域进行内容识别,得到该分割区域的文字内容;输出各个分割区域的文字内容。由此,能够有效提高对图片中文字识别的准确性。
技术领域
本发明涉及计算机视觉技术领域,具体地涉及一种文本版面分析方法、装置、计算机设备和存储介质。
背景技术
随着互联网图片内容的不断增加,以及办公扫描打印文件的日益增加,常需要将扫描打印的图片转化为文字信息,因而如何实现高效的文字识别和检测,以快速完成扫描打印的图片中文字转化成为一个亟需解决的问题。
目前常见的识别方案一般包含文字定位和识别两部分,文字行定位的准确性与识别的准确率成线性正比关系。但是从文档中得到文本内容很容易,但是这些文本内容位置是随机的,尤其是对印刷歪的图片进行识别时,其识别内容的准确性较低。
发明内容
本发明解决的技术问题是如何提供一种能够准确识别图片中的文字内容的文本版面分析方法。
为解决上述技术问题,本发明实施例提供一种文本版面分析方法,所述方法包括:获取目标图片;对所述目标图片进行版面区域分割,得到若干个分割区域;根据所述目标图片的纹理特征识别所述目标图片的文字区域;将所述目标图片中的文字区域与所述若干个分割区域进行匹配,以得到各个分割区域包含的文字区域;对每一分割区域包含的文字区域进行内容识别,得到该分割区域的文字内容;输出各个分割区域的文字内容。
可选的,对每一分割区域包含的文字区域进行内容识别时,属于同一分割区域的文字区域被一并传输至文本识别模型进行识别。
可选的,所述对每一分割区域包含的文字区域进行内容识别,包括:对每一分割区域中包含的各个文字区域分别进行内容识别,得到该文字区域的文字内容;将各个文字区域的文字内容进行拼接,得到该分割区域的文字内容。
可选的,所述根据所述目标图片的纹理特征识别所述目标图片的文字区域,包括:将所述目标图片通过多个卷积核进行卷积运算,以从所述目标图片提取文字对应的若干个纹理特征层;为所述若干个纹理特征层中部分或全部的纹理特征层分别分配多个不同感受野的锚点区域;对所述分配的锚点区域进行回归,得到所述目标图片的文字区域。
可选的,所述根据所述目标图片的纹理特征识别所述目标图片的文字区域,包括:通过将所述目标图片输入纹理提取模型中,得到所述目标图片不同特征维度的若干个纹理特征层,所述纹理提取模型是根据历史图片中的纹理特征进行分析得到的、用以提取输入的图片中的纹理特征层的模型;从所述若干个纹理特征层中筛选出基础纹理特征层;将所述基础纹理特征层进行特征叠加,得到所述目标图片的文字特征层;根据所述文字特征层获取所述目标图片的文字区域。
可选的,所述文字区域为目标图片中包含的每行文字对应的区域。
可选的,输出的各个分割区域的文字内容为字符串。
本发明实施例还提供一种文本版面分析装置,所述装置包括:图片获取模块,用于获取目标图片;版面分割模块,用于对所述目标图片进行版面区域分割,得到若干个分割区域;区域识别模块,用于根据所述目标图片的纹理特征识别所述目标图片的文字区域;版面分析模块,用于将所述目标图片中的文字区域与所述若干个分割区域进行匹配,以得到各个分割区域包含的文字区域;内容识别模块,用于对每一分割区域包含的文字区域进行内容识别,得到该分割区域的文字内容;输出模块,用于输出各个分割区域的文字内容。
本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述文本版面分析方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010219551.2/2.html,转载请声明来源钻瓜专利网。