[发明专利]基于图片的文字识别方法、系统及存储介质在审
申请号: | 202011356196.X | 申请日: | 2020-11-27 |
公开(公告)号: | CN112464944A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 宋文甫;邓双华 | 申请(专利权)人: | 惠州市创荣发实业有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06F40/103;G06K9/20 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄广龙 |
地址: | 516083 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 文字 识别 方法 系统 存储 介质 | ||
本发明公开了一种基于图片的文字识别方法、系统及存储介质。其中基于图片的文字识别方法包括:获取待处理图片;识别所述待处理图片的文字区域;根据所述文字区域内的图元文字与预设字模库,得到可编辑格式的字模文字,所述预设字模库包含所述图元文字和所述字模文字的第一匹配信息;识别所述文字区域中所述图元文字的文字格式,并根据所述文字格式对应调整所述字模文字的格式。本发明通过识别文字区域中图元文字的文字格式,并根据文字格式对应改变字模文字的格式,以得到与待处理图片中图元文字相同文字格式的字模文字,无需用户得到可编辑格式的字模文字后再自动改变字模文字的文字格式,从而提高了用户的体验感。
技术领域
本发明涉及文字识别的技术领域,尤其是涉及一种基于图片的文字识别方法、系统及存储介质。
背景技术
在人工智能领域,光学字符识别作为计算机视觉的经典研究项目,在计算机领域得到了广泛的应用。而随着神经网络和深度学习技术的应用,识别软件能够快速且准确地通过扫描、截图、图片上传等方式,识别常见的文字,并将其转换成计算机能够编辑的文字。
虽然识别软件能够识别图片中的文字以转换成可编辑的文字,但是无论图片中的文字格式如何,转换成可编辑的文字格式都是一样的,与图片中的文字格式不一致,需要用户自动改变转换后的文字格式,从而降低用户的体验感。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于图片的文字识别方法,能够改变字模文字的格式,以得到与待处理图片相同格式的字模文字,减少字后的处理工作,提高用户的体验感。
本发明还提出一种基于图片的文字识别系统。
本发明还提出一种计算机可读存储介质。
第一方面,本发明的一个实施例提供了基于图片的文字识别方法,包括:
获取待处理图片;
识别所述待处理图片的文字区域;
根据所述文字区域内的图元文字与预设字模库,得到可编辑格式的字模文字,所述预设字模库包含所述图元文字和所述字模文字的第一匹配信息;
识别所述文字区域中所述图元文字的文字格式,并根据所述文字格式对应调整所述字模文字的格式。
本发明实施例的基于图片的文字识别方法至少具有如下有益效果:通过识别文字区域中图元文字的文字格式,并根据文字格式对应改变字模文字的格式,以得到与待处理图片中图元文字相同文字格式的字模文字,无需用户得到可编辑格式的字模文字后再自动改变字模文字的文字格式,从而提高了用户的体验感。
根据本发明的另一些实施例的基于图片的文字识别方法,还包括:
识别所述文字区域的段落格式;
根据所述段落格式修正所述字模文字的位置。
根据本发明的另一些实施例的基于图片的文字识别方法,所述段落格式包括:段落连接、段落分段;所述根据所述段落格式修正所述字模文字的位置,包括:
根据所述段落连接删除两个所述字模文字之间的空格或换行符;
根据所述段落分段将相邻的两个所述字模文字换行分段。
根据本发明的另一些实施例的基于图片的文字识别方法,还包括:
根据所述文字区域中的图元符号与所述预设字模库,得到可编辑格式的字模符号,所述预设字模库还包括所述图元符号和字模符号的第二匹配信息;
识别所述文字区域中的符号类型,并根据所述符号类型修正所述字模符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州市创荣发实业有限公司,未经惠州市创荣发实业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011356196.X/2.html,转载请声明来源钻瓜专利网。