[发明专利]一种结合STN模块的文本检测深度学习方法及系统在审
申请号: | 201811528158.0 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109635743A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 侯进;黄贤俊 | 申请(专利权)人: | 深源恒际科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/36 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 孙民兴 |
地址: | 100086 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本检测 文本条目 变换矩阵 网络模块 矫正 定位技术 定位检测 平面文档 区域检测 输入图片 图像变换 图像特征 网络框架 文档图像 算法 学习 图像 场景 统一 | ||
1.一种结合STN模块的文本检测深度学习方法,其特征在于,包括:
基于STN深度网络模块,对输入图片进行图像变换的相关变换矩阵参数进行学习与估计,利用相关变换矩阵参数对图像特征进行矫正变换;
通过文本检测算法对矫正变换后的图像上的文本条目区域进行定位检测。
2.如权利要求1所述的结合STN模块的文本检测深度学习方法,其特征在于,STN深度网络模块的目标设计为旋转、防射、透视变换中的至少一种。
3.如权利要求1所述的结合STN模块的文本检测深度学习方法,其特征在于,所述文本检测算法为Faster RCNN、EAST、CTPN、TextBoxes,以及RRCNN中的任意一种。
4.一种结合STN模块的文本检测深度学习系统,其特征在于,包括图像变换矫正模块和文本条目检测模块;其中,
所述图像变换矫正模块用于基于STN深度网络模块,对输入图片进行图像变换的相关变换矩阵参数进行学习与估计,利用相关变换矩阵参数对图像特征进行矫正变换;
所述文本条目检测模块用于通过文本检测算法对矫正变换后的图像上的文本条目区域进行定位检测。
5.如权利要求4所述的结合STN模块的文本检测深度学习系统,其特征在于,STN深度网络模块的目标设计为旋转、防射、透视变换中的至少一种。
6.如权利要求4所述的结合STN模块的文本检测深度学习系统,其特征在于,所述文本条目检测模块采用Faster RCNN、EAST、CTPN、TextBoxes,以及RRCNN中的任意一种算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深源恒际科技有限公司,未经深源恒际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811528158.0/1.html,转载请声明来源钻瓜专利网。