[发明专利]一种文字识别方法、装置、设备及介质在审
申请号: | 202110693328.6 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113392827A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 游锦成 | 申请(专利权)人: | 平安健康保险股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 吴英铭 |
地址: | 200000 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 装置 设备 介质 | ||
1.一种文字识别方法,其特征在于,所述方法包括:
对图像中曲形排列的文字内容进行文字定位,得到每个文字所对应的文字定位框;
根据每个所述文字定位框的中线与水平方向的夹角,对每个所述文字进行旋转操作,得到正向文字内容;
根据所述正向文字内容中的每个文字的外接矩形,调整所述正向文字内容中的文字的大小,得到调整后的文字;
根据所述曲形排列的文字内容中的所述文字定位框之间的位置关系,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容;
对所述待识别文本内容进行文字识别,得到文本识别结果。
2.如权利要求1所述的文字识别方法,其特征在于,所述根据每个所述文字定位框的中线与水平方向的夹角,对每个所述文字进行旋转操作,得到正向文字内容包括:
获取所述文字定位框的中线与水平方向的夹角,根据所述文字定位框的中线与水平方向的夹角将每个所述文字旋转至正向,所述正向为所述文字定位框的中线与水平方向的夹角为直角的方向。
3.如权利要求1所述的文字识别方法,其特征在于,调整所述正向文字内容中的文字的大小的方法为:
计算所有文字的外接矩形的高的均值,当所述文字的外接矩形的高小于预定值时,将所述文字放大至所述文字的外接矩形的高等于所述均值的程度;当所述文字的外接矩形的高大于所述均值时,将所述文字缩小至所述文字的外接矩形的高等于所述均值的程度。
4.如权利要求1所述的文字识别方法,其特征在于,所述根据所述曲形排列的文字内容中的所述文字定位框之间的位置关系,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容包括:
在所述曲形排列的文字内容中确定起始文字定位框,根据所述起始文字定位框建立定位框排序表;
以所述起始定位框为基准,根据其他文字定位框与所述起始定位框的距离确定扩展方向,并将所述扩展方向上与所述起始文字定位框距离最近的文字定位框扩展进所述定位框排序表,以新扩展进所述定位框排序表中的文字定位框为基准对余下的所述其他文字定位框进行扩展,直至将全部的所述文字定位框扩展进所述定位框排序表;
按照所述定位框排序表中的所述文字定位框的排列顺序,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容。
5.如权利要求4所述的文字识别方法,其特征在于,所述在曲形排列的文字内容中确定起始文字定位框包括:
获取所述曲形排列的文字内容中每个所述文字定位框的重心,将所述重心位于最上方的文字定位框确定为基准文字定位框。
6.如权利要求4所述的文字识别方法,其特征在于,当所述曲形文字区域呈圆弧或者椭圆弧形排列时,所述在曲形排列的文字内容中确定起始文字定位框包括:
对所述曲形文字区域进行定位,得到所述曲形文字区域的边界点集;
对所述曲形文字区域进行分割,确定所述曲形文字区域的边界点集的上边界点集,并确定所述上边界点集的起始点;
将距离所述上边界点集的起始点最近的文字定位框确定为起始文字定位框。
7.如权利要求1-6任意一项所述的文字识别方法,其特征在于,所述对所述待识别文本内容进行文字识别,得到文本识别结果包括:
当所述待识别文本内容具有多种文字组合时,采用自然语言处理算法对所述多种文字组合进行语义识别,选取语义最通顺的文字组合作为最终的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安健康保险股份有限公司,未经平安健康保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110693328.6/1.html,转载请声明来源钻瓜专利网。