[发明专利]用于识别字符的方法、装置、设备和介质在审

申请号：	202011309357.X	申请日：	2020-11-20
公开（公告）号：	CN112418217A	公开（公告）日：	2021-02-26
发明（设计）人：	杜宇宁;杨烨华;李晨霞;郭若愚;赵乔;刘其文;毕然;胡晓光;于佃海;马艳军	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06N20/00;G06N3/08
代理公司：	北京市金杜律师事务所 11256	代理人：	赵林琳;姚杰
地址：	100094 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于识别字符方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了用于识别字符的方法、装置、设备和介质，涉及人工智能尤其深度学习、图像处理领域。该识别字符方法包括获取图像，图像包括字符。该方法还包括检测图像以确定与图像上的字符相对应的检测框。该方法还包括响应于确定检测框被校正，确定图像中的、与经校正的检测框相对应的图像部分中的字符。通过该方法，可以显著的提升图像中字符的标注速率，节省了大量的时间和人力成本，提高了图像处理速度。

技术领域

本公开的实施例主要涉及人工智能领域，并且更具体地，涉及深度学习和图像处理领域的用于识别字符的方法、装置、设备和介质。

背景技术

图像处理是利用计算机对图像进行分析，以获得所需结果。随着人工智能的发展，图像成为计算机获取信息的重要途径。为了更好的处理图像，在机器学习领域中各种处理图像的方法得到了快速的发展。

深度学习(Deep Learning，DL)是机器学习领域中一个新的研究方向。深度学习是机器学习的一种，其可以用于处理各种图像。深度学习技术在对图像处理以执行各种任务时，不仅需要好的算法模型，还需要对原始的图片和数据的进行高质量标注。

发明内容

本公开提供了一种用于识别字符的方法、装置、设备以及存储介质。

根据本公开的第一方面，提供了一种用于识别字符的方法。该方法包括获取图像，图像包括字符。该方法还包括检测图像以确定与图像上的字符相对应的检测框。该方法还包括响应于确定检测框被校正，确定图像中的、与经校正的检测框相对应的图像部分中的字符。

根据本公开的第二方面，提供了一种用于识别字符的装置。该装置包括图像获取模块，被配置为获取图像，图像包括字符；图像检测模块，被配置为检测图像以确定与图像上的字符相对应的检测框；以及第一字符确定模块，被配置为响应于确定检测框被校正，确定图像中的、与经校正的检测框相对应的图像部分中的字符。

根据本公开的第三方面，提供了一种电子设备。该电子设备包括至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开的第一方面的方法。

根据本公开的第四方面，提供一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行根据本公开的第一方面的方法。

根据本申请的技术解决了图像中字符标注的问题，提高了字符标注的效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示出了本公开的多个实施例能够在其中实现的环境100的示意图；

图2示出了根据本公开的一些实施例的用于识别字符的方法200的流程图；

图3A示出了用于本公开的一些实施例的图像300的示例；

图3B示出了用于本公开的一些实施例的确定了检测框的图像300的示例；

图4示出了根据本公开的一些实施例的用于确定经校正的检测框内的字符及校正字符的方法400的流程图；

图5示出了根据本公开的一些实施例的用于识别字符的过程500的流程图；

图6示出了根据本公开的一些实施例的用于识别字符的装置600的框图；以及

图7示出了能够实施本公开的多个实施例的设备700的框图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011309357.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于识别字符的方法、装置、设备和介质在审

专利文献下载