[发明专利]场景文本检测系统和方法有效
申请号: | 201480081759.5 | 申请日: | 2014-09-05 |
公开(公告)号: | CN106796647B | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 汤晓鸥;黄韡林;乔宇 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 文本 检测 系统 方法 | ||
1.一种场景文本检测系统,其包括:
最大稳定极值区域检测器,其被配置成从图像中生成文本成分集合,其中生成的文本成分排序成最大稳定极值区域树形结构;
卷积神经网络分类器,所述卷积神经网络分类器包括两个卷积层、至少一个平均池化层、和支持向量机分类器,以及其中,每个卷积层之后是平均池化层和多个滤波器,所述卷积神经网络分类器配置成将成分置信分数分配到所述文本成分集合中的每个文本成分;
选择器,其被配置成从所述文本成分集合中选择具有分配的成分置信分数中的较高成分置信分数的文本成分;以及
构造器,其被配置成使用选择的文本成分来构造最终文本,
其中,所述两个卷积层的第一卷积层的滤波器被配置成通过使用非监督K均值来根据从预定训练集中提取的图像块集合进行学习以生成响应,并且所述两个卷积层的第二卷积层的滤波器被配置成通过反向传播从所述支持向量机分类器中生成的支持向量机分类误差来基于生成的所述响应进行学习以获取所述文本成分的所述成分置信分数。
2.根据权利要求1所述的场景文本检测系统,其中所述卷积神经网络分类器使用预定训练集进行训练,以分配所述置信分数。
3.根据权利要求1所述的场景文本检测系统,其中所述选择器还包括:
标定装置,其被配置成基于所述分配的成分置信分数和所述最大稳定极值区域树形结构,从所述选择的文本成分中标定出错误连接的文本成分;以及
分割装置,其被配置成将所述错误连接的文本成分分割为具有较高成分置信分数的文本成分。
4.根据权利要求3所述的场景文本检测系统,其中所述分割装置还包括:
调整尺寸单元,其被配置成将所标定出的错误连接的文本成分调整到预定尺寸;
扫描仪,其被配置成扫描调整尺寸后的文本成分,以通过滑动窗口来获取成分置信分数的一维阵列;以及
识别单元,其被配置成基于所述一维阵列来识别所述错误连接的文本成分的峰位置,以将所述错误连接的文本成分分割为具有较高成分置信分数的文本成分。
5.根据权利要求3所述的场景文本检测系统,其中用于标定错误连接的文本成分的条件包括:
所述文本成分的宽度/高度的纵横比大于2;
所述文本成分具有正置信分数;以及
所述文本成分在所述最大稳定极值区域树形结构的端节点,或者具有比所述最大稳定极值区域树形结构中的所有子辈节点大的置信分数。
6.根据权利要求1所述的场景文本检测系统,其中所述构造器还包括:
配对单元,其被配置成将所述选择的文本成分中的具有类似几何和启发性质的两个文本成分配对;以及
合并单元,其被配置成按顺序将具有相同成分和类似方向的配对合并,以构造所述最终文本。
7.一种场景文本检测方法,其包括:
从图像中生成文本成分集合,其中生成的文本成分排序成最大稳定极值区域树形结构;
由经过训练的卷积神经网络分类器将成分置信分数分配到所述文本成分集合中的每个文本成分;
从所述文本成分集合中选择具有分配的成分置信分数中的较高成分置信分数的文本成分;以及
使用选取的文本成分来构造最终文本,
其中所述卷积神经网络分类器包括两个卷积层、至少一个平均池化层、和支持向量机分类器,并且其中所述每个卷积层之后是平均池化层并且具有多个滤波器,所述卷积神经网络分类器通过以下操作来被训练:从预定训练集中提取图像块集合;由所述两个卷积层的第一卷积层的滤波器通过使用非监督K均值来根据所述图像块集合进行学习以生成响应;以及由所述两个卷积层的第二卷积层的滤波器通过反向传播从所述支持向量机分类器中生成的支持向量机分类误差来根据生成的所述响应来进行学习以获取所述文本成分的所述成分置信分数。
8.根据权利要求7所述的场景文本检测方法,其中从图像中生成文本成分集合包括:
通过使用最大稳定极值区域检测器从所述图像中生成所述文本成分集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480081759.5/1.html,转载请声明来源钻瓜专利网。