[发明专利]一种结合STN模块的文本检测深度学习方法及系统在审
申请号: | 201811528158.0 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109635743A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 侯进;黄贤俊 | 申请(专利权)人: | 深源恒际科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/36 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 孙民兴 |
地址: | 100086 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合STN模块的文本检测深度学习方法及系统;其基于STN深度网络模块,对输入图片进行图像变换的相关变换矩阵参数进行学习与估计,利用相关变换矩阵参数对图像特征进行矫正变换;通过文本检测算法对矫正变换后的图像上的文本条目区域进行定位检测。利用STN深度网络模块将文档图像定位和文本条目区域检测两个阶段统一到一个网络框架下,进而发明了一种端到端的平面文档文本条目定位技术,本发明相比于现有技术,整体性能有较大提高,训练成本更低,且实用场景下性能更加稳定可靠。 | ||
搜索关键词: | 文本检测 文本条目 变换矩阵 网络模块 矫正 定位技术 定位检测 平面文档 区域检测 输入图片 图像变换 图像特征 网络框架 文档图像 算法 学习 图像 场景 统一 | ||
【主权项】:
1.一种结合STN模块的文本检测深度学习方法,其特征在于,包括:基于STN深度网络模块,对输入图片进行图像变换的相关变换矩阵参数进行学习与估计,利用相关变换矩阵参数对图像特征进行矫正变换;通过文本检测算法对矫正变换后的图像上的文本条目区域进行定位检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深源恒际科技有限公司,未经深源恒际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811528158.0/,转载请声明来源钻瓜专利网。