[发明专利]图像识别方法以及装置有效
申请号: | 201911198677.X | 申请日: | 2019-11-29 |
公开(公告)号: | CN110929664B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 左凯;程钰茗;应晓伟 | 申请(专利权)人: | 汉海信息技术(上海)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/22;G06V10/24;G06V10/44;G06V10/74;G06V10/26;G06V10/82 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 200050 上海市长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 以及 装置 | ||
1.一种图像识别方法,其特征在于,包括:
获取待识别的图像;
根据所述图像,确定所述图像中至少一个文本行对应的多边形区域;
针对每个多边形区域,根据预先训练的角度纠正模型,确定该多边形区域包含的文本行在所述图像中的文字竖直方向;
根据该多边形区域,确定该多边形区域对应的最小外接矩形;
根据确定出的最小外接矩形以及所述文字竖直方向,确定所述文本行对应的外接四边形的竖边所在的直线;
根据确定出的竖边所在的直线、该多边形区域对应的凸包的每个角点、所述最小外接矩形的四个角,确定所述文本行对应的外接四边形区域;
确定该多边形区域对应的每个角点,作为第一类型点;
确定所述最小外接矩形的每个角所在的点,作为第二类型点;
针对每个第二类型点,确定各第一类型点与该第二类型点的连线,以及确定各连线所在的直线与各竖边所在的直线的交点;
根据该第二类型点与其他第二类型点的位置关系,从各交点中确定所述文本行对应的外接四边形的角所在的点;
根据确定出的外接四边形的角所在的点,确定所述外接四边形区域,作为待识别区域;
确定所述图像中各待识别区域分别包含的文本行的字符串。
2.如权利要求1所述的方法,其特征在于,根据预先训练的角度纠正模型,确定该多边形区域包含的文本行在所述图像中的文字竖直方向,具体包括:
将包含该多边形区域的图像输入预先训练的角度纠正模型,确定该多边形区域与所述图像的水平方向的夹角;
根据确定出的夹角,确定该多边形区域包含的文本行中字符在所述图像中的文字竖直方向。
3.如权利要求1所述的方法,其特征在于,根据确定出的最小外接矩形以及所述文字竖直方向,确定所述文本行对应的外接四边形的竖边所在的直线,具体包括:
针对所述最小外接矩形的每条竖边,确定沿所述文字竖直方向穿过该竖边的中点的直线,为所述文本行对应的外接四边形的竖边所在的直线。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定采集所述图像时的地理位置;
根据已存储的各兴趣点POI的地理位置以及所述图像对应的地理位置,确定与所述图像对应的位置小于预设距离的各POI,作为相关POI;
根据各相关POI包含的信息以及确定出的各文本行的字符串,确定与所述图像匹配的POI,作为所述图像的识别结果。
5.如权利要求4所述的方法,其特征在于,根据各相关POI包含的信息以及确定出的各文本行的字符串,确定与所述图像匹配的POI,具体包括:
针对每个文本行的字符串,确定各相关POI包含的文本信息与该文本行的字符串的文字相似度;
根据确定出的文字相似度,在各相关POI包含的信息中,确定与至少一个字符串匹配的信息,作为匹配信息;
确定包含所述匹配信息的POI与所述图像匹配。
6.如权利要求5所述的方法,其特征在于,确定包含所述匹配信息的POI与所述图像匹配,具体包括:
确定各相关POI包含的图像;
确定所述待识别的图像分别与各相关POI包含的图像的图像相似度;
确定包含所述匹配信息且图像相似度大于预设值的POI与所述待识别的图像匹配。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6任一所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉海信息技术(上海)有限公司,未经汉海信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911198677.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序