[发明专利]图像处理方法、文本识别方法、装置和电子系统有效
申请号: | 201910106716.2 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109829437B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 贺欣;姚聪 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V10/774;G06K9/62;G06N3/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 张阳 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种图像处理方法、文本识别方法、装置和电子系统;其中,该图像处理方法包括:获取待处理图像;通过预先训练完成的特征提取网络,从待处理图像中提取特征图;特征图中包含有文本行的几何属性;根据几何属性,确定文本行的矫正基准点;根据矫正基准点的当前位置和预设的目标位置,确定矫正变换函数;根据矫正变换函数变换特征图,以通过变换后的特征图得到矫正后的图像。本发明中,由于文本行的几何属性可以准确地描述文本行的形状,即使是形变严重的文本行,基于几何属性确定的矫正变化函数也可以使文本行矫正至规则形状,从而提高了后续文本识别的准确性。 | ||
搜索关键词: | 图像 处理 方法 文本 识别 装置 电子 系统 | ||
【主权项】:
1.一种图像处理方法,其特征在于,所述方法包括:获取待处理图像;通过预先训练完成的特征提取网络,从所述待处理图像中提取特征图;所述特征图中包含有文本行的几何属性;根据所述几何属性,确定所述文本行的矫正基准点;根据所述矫正基准点的当前位置和预设的目标位置,确定矫正变换函数;根据所述矫正变换函数变换所述特征图,以通过变换后的所述特征图得到矫正后的图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910106716.2/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序