[发明专利]字符识别方法、装置、智能取餐柜、电子设备及存储介质在审
申请号: | 202011540674.2 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112560845A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 祖春山 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06N3/08 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 智能 取餐柜 电子设备 存储 介质 | ||
本申请提供一种字符识别方法、装置、智能取餐柜、电子设备及存储介质,其中,字符识别方法,包括:将待识别图像转化为标准格式图像;确定所述标准格式图像中的字符区域;基于轻量化字符识别神经网络识别出所述字符区域中的字符串。本申请对需要神经网络处理的图像复杂度、内容都在先进行了简化,因此,采用轻量化的字符识别神经网络即可快速、准确地实现字符识别功能,具有较快的响应速度,且由于采用了轻量化的字符识别神经网络,因此可以大幅降低对设备计算性能的要求。
技术领域
本申请涉及光学字符识别技术领域,尤其涉及一种字符识别方法、装置、智能取餐柜、电子设备及存储介质。
背景技术
光学字符识别(Optical Character Recognition,OCR)是对图像中的文本进行识别,以提取可直接使用的字符信息的技术,在计算机视觉、人工智能等领域的应用越来越广泛。目前,神经网络是实现光学字符识别的主流工具,将神经网络应用于光学字符识别,能够有效提高字符识别的准确度和效率。
但是,为了获取较高的识别准确度和适应各种图像状况,现有用于光学字符识别的神经网络会设计的比较大且复杂,需要采用高性能计算机或者专用服务器来进行运算,具有较高的实施成本,且识别的时效性较差。这使得,在某些真实的应用场景如移动或者嵌入式设备,上述大而复杂的神经网络是难以被应用的,首先是模型过于庞大,面临着内存不足等问题,其次这些场景要求低延迟,或者说响应速度要快,上述神经网络难以满足。例如,若在智能取餐柜中增加光学字符识别功能以识别取餐码,就存在对设备计算性能要求低、响应快的要求,以满足顾客的使用体验。
因此,迫切需要提供一种对设备计算性能要求低、且响应快速的字符识别方案。
发明内容
本申请实施例的目的是提供一种字符识别方法、装置、智能取餐柜、电子设备及存储介质,以解决当前字符识别方式精准度、效率和成本三者不能兼顾的问题。
为解决上述技术问题,本申请实施例提供如下技术方案:
本申请第一方面提供一种字符识别方法,包括:
将待识别图像转化为标准格式图像;
确定所述标准格式图像中的字符区域;
基于轻量化字符识别神经网络识别出所述字符区域中的字符串。
在本申请第一方面的一些变更实施方式中,所述将待识别图像转化为标准格式图像,包括:
将待识别图像转化为符合预设颜色模式和/或预设图像尺寸的标准格式图像。
在本申请第一方面的一些变更实施方式中,所述确定所述标准格式图像中的字符区域,包括:
采用轻量化文本检测神经网络确定出所述标准格式图像中的字符区域。
在本申请第一方面的一些变更实施方式中,所述轻量化文本检测神经网络包括:
采用轻量级神经网络MobileNet作为主干网络的渐进式尺度扩展网络PSENet。
在本申请第一方面的一些变更实施方式中,所述基于轻量化字符识别神经网络识别出所述字符区域中的字符串,包括:
通过仿射变换从所述标准格式图像中提取包含所述字符区域的字符区域图像;
基于轻量化字符识别神经网络,从所述字符区域图像中识别出所述字符区域中的字符串。
在本申请第一方面的一些变更实施方式中,所述轻量化字符识别神经网络,包括:
轻量化卷积递归神经网络。
在本申请第一方面的一些变更实施方式中,所述轻量化卷积递归神经网络的输出层采用局部敏感哈希LSH编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011540674.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:鸡鸭羊养殖用灭蚊装置
- 下一篇:基于车载点云数据的车道边界交互式提取方法