[发明专利]文本识别方法、装置、电子设备及计算机存储介质在审

申请号：	202210667454.9	申请日：	2022-06-13
公开（公告）号：	CN114898351A	公开（公告）日：	2022-08-12
发明（设计）人：	郗叶林;邹永幸;李亚南;王钦功;周孝明	申请（专利权）人：	深圳市商汤科技有限公司
主分类号：	G06V20/62	分类号：	G06V20/62;G06V30/16;G06V30/18
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	李江;吴素花
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置电子设备计算机存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本识别方法，其特征在于，所述方法包括：

获取待识别的图像；

获取所述图像的场景信息和所述图像的对象信息；其中，所述场景信息表征所述图像中的对象所属的应用场景；

基于所述图像的场景信息，确定与所述图像对应的目标文本识别模型集合；

基于所述图像的对象信息，从所述目标文本识别模型集合中确定与所述图像对应的目标文本识别模型；

基于所述目标文本识别模型对所述图像进行文本识别，得到文本识别结果。

2.根据权利要求1所述的方法，其特征在于，所述基于所述图像的场景信息，确定与所述图像对应的目标文本识别模型集合，包括：

将预设关联关系库中，与所述图像的场景信息具有关联关系的文本识别模型集合，确定为与所述图像对应的目标文本识别模型集合；

所述基于所述图像的对象信息，从所述目标文本识别模型集合中确定与所述图像对应的目标文本识别模型，包括：

将所述目标文本识别模型集合中，与所述图像的对象信息具有关联关系的所述文本识别模型，确定为与所述图像对应的目标文本识别模型。

3.根据权利要求1所述的方法，其特征在于，所述获取所述图像的场景信息和所述图像的对象信息，包括：

对所述图像进行图像分析处理，将所述图像划分为背景区域和文本区域；

基于所述背景区域中的内容，确定所述图像的场景信息；

基于所述文本区域中的内容，确定所述图像的对象信息。

4.根据权利要求3所述的方法，其特征在于，所述对所述图像进行图像分析处理，将所述图像划分为背景区域和文本区域，包括：

对所述图像进行区域预处理，确定预选文本区域和预选背景区域；

对所述图像进行轮廓识别，确定文本轮廓；

基于所述预选文本区域和所述文本轮廓，从所述图像中确定所述文本区域；

基于所述预选背景区域和所述文本轮廓，从所述图像中确定所述背景区域。

5.根据权利要求4所述的方法，其特征在于，所述对所述图像进行区域预处理，确定预选文本区域和预选背景区域，包括：

对所述图像进行对象检测，确定所述图像中包含所述对象的对象区域；

从所述对象区域中确定所述预选文本区域；

将所述图像中除所述预选文本区域之外的区域确定为所述预选背景区域。

6.根据权利要求3至5中任一项所述的方法，其特征在于，所述基于所述背景区域中的内容，确定所述图像的场景信息，包括：

分别确定所述背景区域的内容与预设数据库中的各个预设背景内容之间的相似度；

根据大于预设阈值的相似度对应的预设背景内容的场景信息，确定所述图像的场景信息。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述基于所述目标文本识别模型对所述图像进行文本识别，得到文本识别结果，包括：

利用所述目标文本识别模型，将所述图像的文本区域中的内容由图像格式转换为文本格式；

根据图像格式的内容在所述图像中的位置信息，对文本格式的内容进行组合，得到所述文本识别结果。

8.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：

获取至少一组样本图像；其中，每组所述样本图像对应一种场景信息；

针对每一所述场景信息，利用与所述场景信息对应的一组所述样本图像对初始模型进行训练，得到所述场景信息对应的文本识别模型；

根据每一所述场景信息对应的至少一个文本识别模型，得到每一所述场景信息对应的文本识别模型集合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司，未经深圳市商汤科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210667454.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载