[发明专利]图像识别方法和系统在审
申请号: | 202010313920.4 | 申请日: | 2020-04-20 |
公开(公告)号: | CN113536858A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李兆海;王永攀;何梦超 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 系统 | ||
本申请公开了一种图像识别方法和系统。其中,该方法包括:获取第一图像和第二图像,第一图像中包含的第一文本数据的排列方向为第一方向,第二图像包含的第二文本数据的排列方向为第二方向;利用文本识别模型对第一图像和第二图像进行处理,得到第一图像的第一识别结果和第二图像的第二识别结果;其中,文本识别模型用于将第一图像和第二图像输入至特征提取模型,得到第一图像的第一特征序列和第二图像的第二特征序列,将第一特征序列输入至第一识别模型,得到第一识别结果,并将第二特征序列输入至第二识别模型,得到第二识别结果。本申请解决了相关技术中文本识别方法对多个方向排列的文本数据进行识别,浪费计算和存储资源的技术问题。
技术领域
本申请涉及图像识别领域,具体而言,涉及一种图像识别方法和系统。
背景技术
目前,可以通过文本识别算法对图像进行识别,以识别出图像中包含的文本数据。由于传统的文本行识别算法只能处理一种方向排列的文本数据,当需要对多个方向排列的文本数据进行识别时,一种简单的解决方案是分别训练多个模型,每个模型用于处理一种方向排列的文本数据。但是,该方案需要存储多个模型,并通过多个模型分别进行计算,导致计算资源和存储资源浪费。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图像识别方法和系统,以至少解决相关技术中文本识别方法对多个方向排列的文本数据进行识别,浪费计算和存储资源的技术问题。
根据本申请实施例的一个方面,提供了一种图像识别方法,包括:获取第一图像和第二图像,其中,第一图像中包含有第一文本数据,第二图像包含有第二文本数据,第一文本数据的排列方向为第一方向,第二文本数据的排列方向为第二方向;利用文本识别模型对第一图像和第二图像进行处理,得到第一图像的第一识别结果和第二图像的第二识别结果;其中,文本识别模型用于将第一图像和第二图像输入至特征提取模型,得到第一图像的第一特征序列和第二图像的第二特征序列,将第一特征序列输入至第一识别模型,得到第一识别结果,并将第二特征序列输入至第二识别模型,得到第二识别结果。
根据本申请实施例的另一方面,还提供了一种图像识别装置,包括:第一获取模块,用于获取第一图像和第二图像,其中,第一图像中包含有第一文本数据,第二图像包含有第二文本数据,第一文本数据的排列方向为第一方向,第二文本数据的排列方向为第二方向;处理模块,用于利用文本识别模型对第一图像和第二图像进行处理,得到第一图像的第一识别结果和第二图像的第二识别结果;其中,文本识别模型用于将第一图像和第二图像输入至特征提取模型,得到第一图像的第一特征序列和第二图像的第二特征序列,将第一特征序列输入至第一识别模型,得到第一识别结果,并将第二特征序列输入至第二识别模型,得到第二识别结果。
根据本申请实施例的另一方面,还提供了一种图像识别方法,包括:获取第一图像和第二图像,其中,第一图像中包含有第一文本数据,第二图像包含有第二文本数据,第一文本数据的排列方向为第一方向,第二文本数据的排列方向为第二方向;对第一图像和第二图像进行特征提取,得到第一图像的第一特征序列和第二图像的第二特征序列;基于第一特征序列,获取第一图像的第一识别结果;基于第二特征序列,获取第二图像的第二识别结果。
根据本申请实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图像识别方法。
根据本申请实施例的另一方面,还提供了一种计算设备,包括:存储器和处理器,存储器用于存储程序,处理器用于运行程序,其中,程序运行时执行上述的图像识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313920.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:结构化查询语言的翻译方法、装置、计算设备及可读存储介质
- 下一篇:一种洗衣机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序