[发明专利]图片处理方法、装置、存储介质及电子设备在审
申请号: | 202010230790.8 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111444922A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 刘鹏 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 处理 方法 装置 存储 介质 电子设备 | ||
本申请公开了一种图片处理方法、装置、存储介质及电子设备。该方法包括:获取待处理图片;调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;从所述多个区域中确定出目标区域;对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。本申请可以提高对图片中的文字进行识别的灵活性。
技术领域
本申请属于电子技术领域,尤其涉及一种图片处理方法、装置、存储介质及电子设备。
背景技术
在现实生活中,文字无处不在。然而,很多文字信息最初是通过拍摄以图片形式存在的,如身份证、银行卡、护照、名片、票据、书籍等等。若需要获取这些文字信息,则需要对图片中的文字进行识别,并输出识别出的文字。
在实际应用中,在需要对图片中的文字进行识别时,可能存在需要识别一张图片中的所有文字的用户需求,也可能存在仅需要识别一张图片的部分区域中的文字的用户需求。而相关技术所提供的方案仅能满足识别一张图片中的所有文字的用户需求。可见,相关技术所提供的方案的灵活性较差。
发明内容
本申请实施例提供一种图片处理方法、装置、存储介质及电子设备,可以提高对图片中的文字进行识别的灵活性。
本申请实施例提供一种图片处理方法,包括:
获取待处理图片;
调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;
从所述多个区域中确定出目标区域;
对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。
本申请实施例提供一种图片处理装置,包括:
获取模块,用于获取待处理图片;
调用模块,用于调用预训练的图像语义分割模型将所述待处理图片划分为多个区域,其中,每个区域对应一类别,所述类别包括文本类别、表格类别和图片类别;
确定模块,用于从所述多个区域中确定出目标区域;
识别模块,用于对所述目标区域进行文字识别处理,以识别得到所述目标区域中的文字。
本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的图片处理方法中的流程。
本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的图片处理方法中的流程。
本申请实施例中,可调用预训练的图像语义分割模型将待处理图片划分为多个区域,从而在仅需要识别多个区域中的某一个区域的文字时,可以将该区域确定为目标区域;在需要识别出整个待处理图片中的文字时,可将该多个区域均确定为目标区域,再对确定出的目标区域进行文字识别处理。可见,本申请实施例提供的图片处理方法可以提高对图片中的文字进行识别的灵活性。
附图说明
下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。
图1是本申请实施例提供的图片处理方法的第一种流程示意图。
图2是本申请实施例提供的待处理图片示意图。
图3是本申请实施例提供的场景示意图。
图4是本申请实施例提供的图片处理方法的第二种示意图。
图5是本申请实施例提供的图像语义分割模型的网络结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010230790.8/2.html,转载请声明来源钻瓜专利网。